Çin'in Yapay Zeka Analog Çipinin Nvidia'nın A100 GPU'sundan 3000 Kat Daha Hızlı Olduğu İddia Edildi - Dünyadan Güncel Teknoloji Haberleri

Çin'in Yapay Zeka Analog Çipinin Nvidia'nın A100 GPU'sundan 3000 Kat Daha Hızlı Olduğu İddia Edildi - Dünyadan Güncel Teknoloji Haberleri
Artık, bu çipleri TSMC gibi şirketlerin 2025’e kadar taahhüt etmiş oldukları üretim taahhütlerine eklemek için gereken üretim miktarına veya mevcut kapasiteye sahip değiliz; ancak herhangi bir şeyi ölçeklendirme taahhüdünde bulunmadan önce bu deneysel sonuçlara her zaman ihtiyaç duyulmaktadır OAC’deki nöron sayısı 500 × 500’dür Bu, belirli dalga boylarındaki lazer darbeleri yoluyla yapılabilir (bunu Çin’in Kuantum Anahtar Dağıtımı hakkındaki son makalemizde araştırdık) Yaratıcılık Sınırlamaların etrafından dolaşabilmek şüphesiz Çin’in yaptırımlar hakkında düşünme şeklidir

Görünüşe göre ACCEL gibi analog bilgi işlem sistemlerinin geniş ölçekte uygulanması, fiziksel imkansızlıktan ziyade üretim verimi ve endüstriye uyum meselesidir B, OAC işlemenin simüle edilmiş örnekleri

Nature’da yayınlandığı üzere, ACCEL’in görüntü görevlerinde saniyede 4,6 trilyon işlem gerçekleştirdiği belirtiliyor; dolayısıyla Nvidia’nın A100 (Ampere) ve 0,312 katrilyon işlemine kıyasla 3 Araştırma makalesine göre ACCEL, 1 W güçte (araştırmacıların “sistemik enerji verimliliği” dediği şey) saniyede 74,8 katrilyon işlem ve saniyede 4,6 peta işlemlik hesaplama hızı gerçekleştirebiliyor sonuç) Ancak bilgisayarlı görme görevleri için doğruluk gereklidir yüz tanıma gibi genel Sıkıştırma oranı, OAC çıkışının boyutluluğunun orijinal görüntülerin boyutluluğuna oranıdır DSayısal simülasyonlarla elde edilen farklı OAC sıkıştırma oranları altında üç katmanlı, tamamen bağlı bir dijital NN’ye (Ek Tablo 1) bağlı giriş olarak OAC çıkışını kullanarak sınıflandırma doğruluğu e, EAC çipinin fotoğrafı Kırmızı kesikli çizgi, giriş olarak OAC içermeyen orijinal görüntüleri kullanan dijital NN’nin sınıflandırma doğruluğudur

Çin’deki Tsinghua Üniversitesi’nden yeni bir makale, bilgisayarla görme görevlerinde uzmanlaşmış ultra hızlı ve yüksek verimli bir yapay zeka işleme çipinin geliştirilmesini ve çalışmasını anlatıyor Evet, bu özel bir çip; ancak bunu pazarın parçalanması olarak görmek yerine, yarı iletkenlerin “her şeyi kapsayan” bir konfigürasyondan ziyade belirli bir ihtiyaca uyacak şekilde giderek daha fazla tasarlandığı heterojen bilgi işlemin geleceğine doğru atılmış bir adım olarak görebiliriz OAC’deki faz maskesinin piksel boyutu 3 µm ve kırınım mesafesi 3 mm’dir O zamandan beri Nvidia’nın A100’ünün yerini Hopper ve onun 80 milyar transistörlü H100 süper çipi aldı, ancak bu bile bu sonuçlar karşısında pek etkileyici görünmüyor Bu görüntülerin ACCEL aracılığıyla derin öğrenmeyle işlenmesi bir darboğaz oluşturacak gibi görünmüyor Bu optik işleme sisteminin bir sonucu olarak, daha az enerji gereksinimi vardır ve termal dağılım nedeniyle boşa harcanan elektronlar vardır Çin’e tüm yaptırımların uygulanmasına rağmen, ülkenin araştırma ve geliştirme çalışmalarının, engellendiği şey ne olursa olsun, onu yakalamasına ve bazı açılardan görünüşe göre iyileştirmesine olanak tanıdığına tanık olmak belki de ilginç olabilir B, ACCEL’in iş akışı Örneğin ACCEL, operasyonun beyni olan Elektronik Analog Hesaplama birimi (EAC) için standart 180 nm CMOS teknolojisiyle üretildi 0000 kat performans artışı elde ediliyor Ancak yüksek performanslı yapay zeka analog çiplerinin hâlâ geniş ölçekte kullanılmamasının bir nedeni var: Üretimleri şu anda araştırma çabaları ve prototip çalışma dışında herhangi bir şeye hizmet edemeyecek kadar düşük Çip, 32 × 32 fotodiyot dizisi, iki kapasitans dengeleme modülü P-CCM ve N-CCM, voltaj çıkış modülü ve çevresel SRAM I/O ve kontrol cihazından oluşur , yoğunluk; PD, fotodiyot Ölçek çubuğu, 500 mikron

Ancak fotonik, optik bir sistem, bilgiyi aktarmanın, çalıştırmanın ve kodlamanın elektriksel olmayan yollarından yararlanır

Araştırma ekibinin eş liderlerinden Dai Qionghai şunları söyledi: “Yapay zeka çağı için yeni bir bilgi işlem mimarisi geliştirmek, zirveye ulaşmış bir başarıdır Sonuçta her şey planlama, harcama ve zaman meselesi

Elbette herhangi bir işlem sisteminde hız çok önemlidir

Bu %99’luk rakam, en azından ACCEL ve diğer analog olmayan yaklaşımlar arasındaki enerji verimliliği eşitsizliğini açıklamakla alakalıdır: Nvidia’nın GPU’su %100 dijitaldir, yani çalışması sürekli elektron akışına dayalıdır (ve atık ısı üretir) Kırınımlı bir optik hesaplama modülü, özellik çıkarımı için optik alandaki giriş görüntüsünü işler ve çıkış ışık alanı, analog elektronik hesaplama için doğrudan fotodiyot dizisi tarafından foto akımlar üretmek için kullanılır Ancak daha önemli olan zorluk, bu yeni mimariyi pratik uygulamalara taşımak, önemli ulusal ve kamusal ihtiyaçları çözmektir ki bu da bizim sorumluluğumuzdur H, Her pikselin büyütülmüş devre yapısı (Resim kredisi: Tsinghua Üniversitesi/Doğa)

ACCEL, Uygulamaya Özel Entegre Devre (ASIC) tasarımının analog bir versiyonu gibi görünüyor

ABüyük ölçekli görüntülerden özellik çıkarımı için OAC ilkesi Karşılaştırıcı, ACCEL’in tahmin edilen sonucu olarak darbeyi maksimum voltajla çıkarır 000 katından fazla performans sunabilen özel bir mimaride fotonik ve analog bilgi işlemden yararlanıyor daha düşük Fotonik sistemlerin kuantum hesaplama ve HPC (Yüksek Performanslı Bilgi İşlem) kurulumlarında kullanılmasının nedeni de budur

Eş zamanlı olarak, elektronların yarı iletkenler üzerindeki düzenli ama dağınık hareketinden uzaklaşmanın hız avantajlarından yararlanıyoruz ve yalnızca ışığın kendisiyle sınırlanan çalışma hızlarının kilidini açıyoruz Tsinghua Üniversitesi’nin makalesi, ACCEL’in Fashion-MNIST, 3 sınıflı ImageNet sınıflandırması ve hızlandırılmış video tanıma görevlerine karşı “rekabet açısından yüksek” doğruluk seviyeleriyle (sırasıyla %85,5, %82,0 ve %92,6) deneysel olarak denendiğini söylüyor OAC, 28 × 28 orijinal girişleri 4 × 4 özelliklere kodlar MZI, Mach-Zehnder interferometresi; D2NN, kırınımlı derin sinir ağı” (Resim kredisi: Tsinghua Üniversitesi/Doğa)

ACCEL durumunda, Tsinghua’nın mimarisi, tek bir çipte ölçeklenebilirlik, doğrusal olmama ve esneklik ile elektronik analog hesaplama (EAC) tarafından desteklenen kırınımlı optik analog hesaplama (OAC) aracılığıyla çalışır – ancak işleminin %99’u optik sistem içinde uygulanır EAC’deki ikili ağırlıklar, fotodiyotların bağlantısını V+ veya V− hatlarına değiştirerek SRAM tarafından her darbe sırasında yeniden yapılandırılır EAC, eşdeğer ağın birden fazla çıkış düğümüne karşılık gelen sıralı darbeler üretir ADC’lerin (Analogdan Dijitale Dönüştürücüler) yüksek enerji ve gecikme maliyetinden kurtulmak, fotoniklerin ortaya çıkardığı performans iyileştirmelerine doğru uzun bir yol kat ediyor Düşük ışık koşullarında üstün sistem sağlamlığı (her karede 0,14 fJ μm−2) ”

Yeni ACCEL çipinin fotonik ve analog olması, IBM’in yakın zamanda başka bir analog yapay zeka hızlandırma çipinin (Hermes) duyurusunu akla getirebilir FKapasitans kompanzasyon modülünün yapısı [QKD] görsel verinin (bir görüntünün) özelliklerini çıkarmak ve iletmek için kullanılan ve neredeyse hareket halindeyken bu ışıkla çalışan (onu değiştiren) bir uydu sistemi (aynı zamanda fotonik tabanlı) C, MNIST veri seti üzerinde sayısal simülasyonlarla elde edilen, farklı sıkıştırma oranları altında OAC çıktıları ile yeniden yapılandırma sonuçlarının SSIM (yapısal benzerlik indeksi)

Bu nesil fotonik tabanlı analog çipler üzerinde son derece rahat litografi seviyelerinde çalışıldığını anlamak da önemlidir Orijinal giriş için örnek görüntüler MNIST veri kümesinden40 izin alınarak uyarlanmıştır C, Görme görevlerinin yüksek hızlı, düşük enerjili işlenmesi için doğrudan bir EAC devresinin önüne entegre edilmiş OAC’li ACCEL şeması Farklı sıkıştırma oranlarına karşılık gelen yeniden yapılandırma görüntülerinin örnekleri köşede görüntülenir Sonuç olarak araştırma makalesi, çip üzerinde yapılan şirket içi testlerin, her karede 72 ns’de düşük hesaplama gecikmesi gösterdiğini iddia ediyor; bu da saniyede yaklaşık 13 GEAC dizisinin yapısı , minimum; Int Doğal olarak, sürecin daha düşük CMOS düğümlerine doğru daha da minyatürleştirilmesiyle daha fazla performans, saat frekansı ve verimlilik iyileştirmeleri elde edilebilir (Nvidia’nın H100’ü 4 nm’lik bir işlemle üretilmiştir) Makaleye göre bu, Mach-Zehnder interferometreleri ve kırınımlı Derin Sinir Ağları (DNN’ler) gibi diğer görüntü mimarilerinde bulunan kısıtlamalarla mücadelede yardımcı oluyor Belirli görevleri hızlandırmak için içindeki analog yolları yeniden yapılandırabilen elektronik analog hesaplama (EAC) biriminin rolü tam olarak budur Sonuçta, bu sistemlerin hayatlarımızı ve uygarlığımızı yönetmek için kullanıldığı uygulama ve yol yelpazesi oldukça geniştir: Giyilebilir cihaz pazarından (muhtemelen XR senaryolarında), otonom sürüşe, endüstriyel denetimlere ve diğer görüntü algılama ve tanıma sistemlerine kadar uzanır au, isteğe bağlı birim; Maksimum, maksimum; Min Elektronik ve Işık Hesaplamayı Birleştiren Tüm Analog Çip (ACCEL), çip olarak adlandırıldığı gibi, dört milyon kat daha fazla enerji tüketimiyle Nvidia A100’ün 3 Bunları, EAC’nin hangi konfigürasyonun hangi göreve uygulanması gerektiğini koordine ettiği, çip içindeki önceden programlanmış algoritmalar olarak düşünün Üç katmanlı, tamamen bağlı bir dijital NN (Ek Tablo 1) görüntüyü OAC çıkış özellikleriyle yeniden yapılandırır Ve bunun gibi çiplere yönelik piyasalar bunlara sahip olmayı çok ister Ayrıca herhangi bir bilgi işlem-görüntü görevinde bir ortak işlemcinin bu görüntülerin bir seçimini analiz etmesi için yeterli çerçeve olacak gibi görünüyor

A, Büyük ölçekli fotodiyot ve ADC dizileri de dahil olmak üzere geleneksel optoelektronik bilgi işlemin iş akışı 000 karelik bir üretime yol açıyor; bu, herhangi bir Doom oyuncusunun gerçekliğin izini kaybetmesine yetecek kadar fazla Optik Analog Hesaplama (OAC) modülünü küçültmek için daha fazla ne tür çalışmalar yapılabileceği belli değil