Çin'in Yapay Zeka Analog Çipinin Nvidia'nın A100 GPU'sundan 3000 Kat Daha Hızlı Olduğu İddia Edildi - Dünyadan Güncel Teknoloji Haberleri

Çin'in Yapay Zeka Analog Çipinin Nvidia'nın A100 GPU'sundan 3000 Kat Daha Hızlı Olduğu İddia Edildi - Dünyadan Güncel Teknoloji Haberleri
000 karelik bir üretime yol açıyor; bu, herhangi bir Doom oyuncusunun gerçekliğin izini kaybetmesine yetecek kadar fazla EAC, eşdeğer ağın birden fazla çıkış düğümüne karşılık gelen sıralı darbeler üretir B, OAC işlemenin simüle edilmiş örnekleri Yaratıcılık Sınırlamaların etrafından dolaşabilmek şüphesiz Çin’in yaptırımlar hakkında düşünme şeklidir e, EAC çipinin fotoğrafı O zamandan beri Nvidia’nın A100’ünün yerini Hopper ve onun 80 milyar transistörlü H100 süper çipi aldı, ancak bu bile bu sonuçlar karşısında pek etkileyici görünmüyor , minimum; Int

Elbette herhangi bir işlem sisteminde hız çok önemlidir

ABüyük ölçekli görüntülerden özellik çıkarımı için OAC ilkesi (Resim kredisi: Tsinghua Üniversitesi/Doğa)

ACCEL, Uygulamaya Özel Entegre Devre (ASIC) tasarımının analog bir versiyonu gibi görünüyor Bu, belirli dalga boylarındaki lazer darbeleri yoluyla yapılabilir (bunu Çin’in Kuantum Anahtar Dağıtımı hakkındaki son makalemizde araştırdık) Ancak yüksek performanslı yapay zeka analog çiplerinin hâlâ geniş ölçekte kullanılmamasının bir nedeni var: Üretimleri şu anda araştırma çabaları ve prototip çalışma dışında herhangi bir şeye hizmet edemeyecek kadar düşük Araştırma makalesine göre ACCEL, 1 W güçte (araştırmacıların “sistemik enerji verimliliği” dediği şey) saniyede 74,8 katrilyon işlem ve saniyede 4,6 peta işlemlik hesaplama hızı gerçekleştirebiliyor Çip, 32 × 32 fotodiyot dizisi, iki kapasitans dengeleme modülü P-CCM ve N-CCM, voltaj çıkış modülü ve çevresel SRAM I/O ve kontrol cihazından oluşur Artık, bu çipleri TSMC gibi şirketlerin 2025’e kadar taahhüt etmiş oldukları üretim taahhütlerine eklemek için gereken üretim miktarına veya mevcut kapasiteye sahip değiliz; ancak herhangi bir şeyi ölçeklendirme taahhüdünde bulunmadan önce bu deneysel sonuçlara her zaman ihtiyaç duyulmaktadır

Görünüşe göre ACCEL gibi analog bilgi işlem sistemlerinin geniş ölçekte uygulanması, fiziksel imkansızlıktan ziyade üretim verimi ve endüstriye uyum meselesidir Sonuçta her şey planlama, harcama ve zaman meselesi

Araştırma ekibinin eş liderlerinden Dai Qionghai şunları söyledi: “Yapay zeka çağı için yeni bir bilgi işlem mimarisi geliştirmek, zirveye ulaşmış bir başarıdır Örneğin ACCEL, operasyonun beyni olan Elektronik Analog Hesaplama birimi (EAC) için standart 180 nm CMOS teknolojisiyle üretildi GEAC dizisinin yapısı 0000 kat performans artışı elde ediliyor Orijinal giriş için örnek görüntüler MNIST veri kümesinden40 izin alınarak uyarlanmıştır Evet, bu özel bir çip; ancak bunu pazarın parçalanması olarak görmek yerine, yarı iletkenlerin “her şeyi kapsayan” bir konfigürasyondan ziyade belirli bir ihtiyaca uyacak şekilde giderek daha fazla tasarlandığı heterojen bilgi işlemin geleceğine doğru atılmış bir adım olarak görebiliriz Çin’e tüm yaptırımların uygulanmasına rağmen, ülkenin araştırma ve geliştirme çalışmalarının, engellendiği şey ne olursa olsun, onu yakalamasına ve bazı açılardan görünüşe göre iyileştirmesine olanak tanıdığına tanık olmak belki de ilginç olabilir Bu görüntülerin ACCEL aracılığıyla derin öğrenmeyle işlenmesi bir darboğaz oluşturacak gibi görünmüyor au, isteğe bağlı birim; Maksimum, maksimum; Min Ayrıca herhangi bir bilgi işlem-görüntü görevinde bir ortak işlemcinin bu görüntülerin bir seçimini analiz etmesi için yeterli çerçeve olacak gibi görünüyor [QKD] görsel verinin (bir görüntünün) özelliklerini çıkarmak ve iletmek için kullanılan ve neredeyse hareket halindeyken bu ışıkla çalışan (onu değiştiren) bir uydu sistemi (aynı zamanda fotonik tabanlı) Ve bunun gibi çiplere yönelik piyasalar bunlara sahip olmayı çok ister

A, Büyük ölçekli fotodiyot ve ADC dizileri de dahil olmak üzere geleneksel optoelektronik bilgi işlemin iş akışı FKapasitans kompanzasyon modülünün yapısı OAC’deki nöron sayısı 500 × 500’dür

Eş zamanlı olarak, elektronların yarı iletkenler üzerindeki düzenli ama dağınık hareketinden uzaklaşmanın hız avantajlarından yararlanıyoruz ve yalnızca ışığın kendisiyle sınırlanan çalışma hızlarının kilidini açıyoruz

Çin’deki Tsinghua Üniversitesi’nden yeni bir makale, bilgisayarla görme görevlerinde uzmanlaşmış ultra hızlı ve yüksek verimli bir yapay zeka işleme çipinin geliştirilmesini ve çalışmasını anlatıyor

Ancak fotonik, optik bir sistem, bilgiyi aktarmanın, çalıştırmanın ve kodlamanın elektriksel olmayan yollarından yararlanır C, Görme görevlerinin yüksek hızlı, düşük enerjili işlenmesi için doğrudan bir EAC devresinin önüne entegre edilmiş OAC’li ACCEL şeması yüz tanıma gibi genel sonuç) ADC’lerin (Analogdan Dijitale Dönüştürücüler) yüksek enerji ve gecikme maliyetinden kurtulmak, fotoniklerin ortaya çıkardığı performans iyileştirmelerine doğru uzun bir yol kat ediyor DSayısal simülasyonlarla elde edilen farklı OAC sıkıştırma oranları altında üç katmanlı, tamamen bağlı bir dijital NN’ye (Ek Tablo 1) bağlı giriş olarak OAC çıkışını kullanarak sınıflandırma doğruluğu H, Her pikselin büyütülmüş devre yapısı OAC, 28 × 28 orijinal girişleri 4 × 4 özelliklere kodlar ”

Yeni ACCEL çipinin fotonik ve analog olması, IBM’in yakın zamanda başka bir analog yapay zeka hızlandırma çipinin (Hermes) duyurusunu akla getirebilir Kırmızı kesikli çizgi, giriş olarak OAC içermeyen orijinal görüntüleri kullanan dijital NN’nin sınıflandırma doğruluğudur Elektronik ve Işık Hesaplamayı Birleştiren Tüm Analog Çip (ACCEL), çip olarak adlandırıldığı gibi, dört milyon kat daha fazla enerji tüketimiyle Nvidia A100’ün 3 C, MNIST veri seti üzerinde sayısal simülasyonlarla elde edilen, farklı sıkıştırma oranları altında OAC çıktıları ile yeniden yapılandırma sonuçlarının SSIM (yapısal benzerlik indeksi) Tsinghua Üniversitesi’nin makalesi, ACCEL’in Fashion-MNIST, 3 sınıflı ImageNet sınıflandırması ve hızlandırılmış video tanıma görevlerine karşı “rekabet açısından yüksek” doğruluk seviyeleriyle (sırasıyla %85,5, %82,0 ve %92,6) deneysel olarak denendiğini söylüyor Ancak bilgisayarlı görme görevleri için doğruluk gereklidir Sonuç olarak araştırma makalesi, çip üzerinde yapılan şirket içi testlerin, her karede 72 ns’de düşük hesaplama gecikmesi gösterdiğini iddia ediyor; bu da saniyede yaklaşık 13 Doğal olarak, sürecin daha düşük CMOS düğümlerine doğru daha da minyatürleştirilmesiyle daha fazla performans, saat frekansı ve verimlilik iyileştirmeleri elde edilebilir (Nvidia’nın H100’ü 4 nm’lik bir işlemle üretilmiştir) Düşük ışık koşullarında üstün sistem sağlamlığı (her karede 0,14 fJ μm−2) , yoğunluk; PD, fotodiyot Sonuçta, bu sistemlerin hayatlarımızı ve uygarlığımızı yönetmek için kullanıldığı uygulama ve yol yelpazesi oldukça geniştir: Giyilebilir cihaz pazarından (muhtemelen XR senaryolarında), otonom sürüşe, endüstriyel denetimlere ve diğer görüntü algılama ve tanıma sistemlerine kadar uzanır Sıkıştırma oranı, OAC çıkışının boyutluluğunun orijinal görüntülerin boyutluluğuna oranıdır OAC’deki faz maskesinin piksel boyutu 3 µm ve kırınım mesafesi 3 mm’dir

Nature’da yayınlandığı üzere, ACCEL’in görüntü görevlerinde saniyede 4,6 trilyon işlem gerçekleştirdiği belirtiliyor; dolayısıyla Nvidia’nın A100 (Ampere) ve 0,312 katrilyon işlemine kıyasla 3 Ancak daha önemli olan zorluk, bu yeni mimariyi pratik uygulamalara taşımak, önemli ulusal ve kamusal ihtiyaçları çözmektir ki bu da bizim sorumluluğumuzdur Farklı sıkıştırma oranlarına karşılık gelen yeniden yapılandırma görüntülerinin örnekleri köşede görüntülenir MZI, Mach-Zehnder interferometresi; D2NN, kırınımlı derin sinir ağı” (Resim kredisi: Tsinghua Üniversitesi/Doğa)

ACCEL durumunda, Tsinghua’nın mimarisi, tek bir çipte ölçeklenebilirlik, doğrusal olmama ve esneklik ile elektronik analog hesaplama (EAC) tarafından desteklenen kırınımlı optik analog hesaplama (OAC) aracılığıyla çalışır – ancak işleminin %99’u optik sistem içinde uygulanır Karşılaştırıcı, ACCEL’in tahmin edilen sonucu olarak darbeyi maksimum voltajla çıkarır

Bu %99’luk rakam, en azından ACCEL ve diğer analog olmayan yaklaşımlar arasındaki enerji verimliliği eşitsizliğini açıklamakla alakalıdır: Nvidia’nın GPU’su %100 dijitaldir, yani çalışması sürekli elektron akışına dayalıdır (ve atık ısı üretir)

Bu nesil fotonik tabanlı analog çipler üzerinde son derece rahat litografi seviyelerinde çalışıldığını anlamak da önemlidir Optik Analog Hesaplama (OAC) modülünü küçültmek için daha fazla ne tür çalışmalar yapılabileceği belli değil Üç katmanlı, tamamen bağlı bir dijital NN (Ek Tablo 1) görüntüyü OAC çıkış özellikleriyle yeniden yapılandırır 000 katından fazla performans sunabilen özel bir mimaride fotonik ve analog bilgi işlemden yararlanıyor daha düşük Kırınımlı bir optik hesaplama modülü, özellik çıkarımı için optik alandaki giriş görüntüsünü işler ve çıkış ışık alanı, analog elektronik hesaplama için doğrudan fotodiyot dizisi tarafından foto akımlar üretmek için kullanılır Makaleye göre bu, Mach-Zehnder interferometreleri ve kırınımlı Derin Sinir Ağları (DNN’ler) gibi diğer görüntü mimarilerinde bulunan kısıtlamalarla mücadelede yardımcı oluyor Bunları, EAC’nin hangi konfigürasyonun hangi göreve uygulanması gerektiğini koordine ettiği, çip içindeki önceden programlanmış algoritmalar olarak düşünün

Belirli görevleri hızlandırmak için içindeki analog yolları yeniden yapılandırabilen elektronik analog hesaplama (EAC) biriminin rolü tam olarak budur B, ACCEL’in iş akışı Fotonik sistemlerin kuantum hesaplama ve HPC (Yüksek Performanslı Bilgi İşlem) kurulumlarında kullanılmasının nedeni de budur Ölçek çubuğu, 500 mikron Bu optik işleme sisteminin bir sonucu olarak, daha az enerji gereksinimi vardır ve termal dağılım nedeniyle boşa harcanan elektronlar vardır EAC’deki ikili ağırlıklar, fotodiyotların bağlantısını V+ veya V− hatlarına değiştirerek SRAM tarafından her darbe sırasında yeniden yapılandırılır