含光800采用平头哥自研芯片架构-净水器资讯
点击关闭

硬件算法-含光800采用平头哥自研芯片架构-净水器资讯

  • 时间:

济南双胞胎白狮

孟建熠認為,EDA承擔的角色至關重要,雲、EDA公司都希望有EDA上雲這樣的交集。不過,目前阿里還只是在嘗試這件事,沒有對外推出,新思科技等合作夥伴正在做EDA上雲,中國慢慢也在往這一前沿領域走。他希望平台能向越來越開放的方向走,如果EDA上雲,開發者可以更快開發出芯片產品,和無劍平台的結合是有價值的。不過,平頭哥本身沒有EDA的工具,需要第三方去做這件事情。

與業界幾款領先的雲端推理芯片相比,含光800的性能大約是第二名的4-5倍,其能效比約是第二名的3.3倍。目前含光800應用於阿里巴巴內部核心業務中。在杭州城市大腦的圖像處理業務測試中,1顆含光800的算力相當於10顆通用GPU。

同日,阿里人工智能實驗室和平頭哥共同定製開發智能語音芯片TG6100N,天貓精靈將成為首款採用平頭哥定製芯片的家用產品。可以看見,AIoT時代下,平頭哥已經率先搭建起生態,並正循序漸進地沿着其「普惠芯片」的目標持續構建行業生態和開發者生態。一方面,平頭哥持續完善其技術及芯片產品陣列;另一方面,平頭哥還將成立芯片開放社區,實現1天上手,5天原型,20天做出產品,進一步為芯片產業提供開放協作的平台。

再比如,拍立淘商品庫每天新增10億商品圖片,使用傳統GPU算力識別需1小時,而使用含光800可將時間縮至5分鐘,搜索效率提升12倍。此外,基於含光800的AI雲服務也正式上線。相比傳統GPU算力,性價比提升100%。這意味着,受限於算力瓶頸的企業可通過阿里雲,在含光800上更高效地運行更複雜、更先進的算法。

高性能背後,芯片架構創新與算法通用性

平頭哥牽頭髮起的IP聯盟,已有Cadence等9家半導體IP供應商加入。此外,平頭哥還同新思科技、阿里雲聯合發佈《雲端設計,與時間賽跑》白皮書。在分論壇期間,孟建熠還談到了芯片行業的新趨勢——Foundry上雲、EDA上雲、開源芯片、定製化芯片。

本文首發於微信公眾號:智東西。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。

這一名字承載了阿里巴巴對芯片公司寄予的厚望,不同於大多數芯片商,面對着有強應用驅動和場景碎片化等特點的AIoT市場,平頭哥的目的不是賣芯片,而是通過端雲一體芯片生態,端上做芯片技術設施,雲端為各行業提供普惠算力,終端玄鐵處理器還可以與雲端含光芯片協同。今年7月,平頭哥發佈第一款基於RISC-V的處理器IP核「玄鐵910」;8月,它又推出第一款一站式芯片設計平台「無劍」;9月,早在一年前就做出預告的雲端AI芯片終於如期而至。

上古神劍,高端芯片造芯,頭件大事就是起名字。國外有英特爾青睞周邊的山川河流,AMD曾鍾情于F1賽道;國內華為對高山和古籍情有獨鍾,紫光展銳看上了動植物所承載的意象,而平頭哥則繼承了馬雲對武俠文化的熱愛,玄鐵、無劍、含光三芯片產品連發,每款都是傳說中的利劍。

結語:雲計算巨頭跨界造芯成大勢

那麼,含光800如何實現如此高的圖像處理能力,高性能的背後又有哪些創新?驕暘告訴智東西,阿里巴巴算法團隊將算法中的一些通用特徵提取出來,幫助含光800芯片實現架構的創新。1、芯片架構設計優化方向過去一年,平頭哥團隊不斷探索芯片和場景的融合,針對場景深度定製了芯片的軟硬件,包括自研架構、軟件編譯器、框架、工具鏈等;後期,平頭哥也針對INT8數據類型做了大量優化,最終在性能、良率、功耗等指標上均表現良好。含光800採用平頭哥自研芯片架構,集成達摩院算法,配以自動化開發工具。其頂層架構採用四核設計,任一NPU Core壞死,都不會影響芯片工作。

1、基礎單元處理器IP在端側,有中天微的背景加持,平頭哥已擁有成熟的生態體系。其C-Sky系列中,CK801、CK802、CK803、CK805、CK807、CK810、CK860等7款自研嵌入式CPU IP核均已得到大規模量產的驗證,授權客戶超100家,累計銷售超十億顆,廣泛應用於機器視覺、工業控制、車載終端、移動通信和信息安全等領域。新發佈的玄鐵系列也為AIoT終端芯片提供高性價比IP。

AI的加速落地使得對底層技術布局愈發迫切。阿里龐大的電商、金融、物流、雲計算、物聯網業務,都對芯片有着越來越大的需求。如今,芯片、AI與雲計算的協調發展已是大勢所趨。AI算法逐漸集成到芯片,專用AI芯片為雲服務提供更強的算力,雲計算又加速了AI應用的大規模落地。對於雲計算廠商而言,自研芯片不僅可以降低整體計算的經濟成本,還能以雲服務的方式將更高算力、更低功耗提供給更多企業。這一趨勢推動下,阿里巴巴造芯成為必然。阿里成立獨立芯片公司平頭哥,既是順應雲計算巨頭造芯的大勢,實現從底層硬件到上層應用的生態自循環;亦是放眼雲計算和AIoT所帶來的廣闊市場,以芯片基礎設施提供商的定位以期獲取新時代的紅利。承載着「普惠芯片」的美好願景,平頭哥已經發佈的產品布局非常清晰:端側處理器IP+芯片設計平台,降低芯片公司造芯難度;雲端AI芯片,通過阿里雲AI使能各企業智能化升級。阿里能否如其所期望的那樣,成為AIoT時代的芯片基礎設施提供商,我們拭目以待。(本賬號系網易新聞·網易號「各有態度」簽約帳號)

含光,上古三大神劍之一。《列子·湯問》中,孔周稱其「視之不可見,運之不知有。其所觸也,泯然無際,經物而物不覺。」即看不見、感覺不到,劃過身體也不疼,正如含光800帶來的無形卻強勁的算力。至於為何從800開始命名,平頭哥AI芯片負責人驕暘說,其實他們最開始想給芯片取名v1.0,後來參考業內其他產品的命名邏輯,800、900代表高端系列,600代表中端系列,200、300代表低端系列。以後平頭哥也會做中端和低端芯片產品。據阿里巴巴CTO張建鋒介紹,這款芯片從設計、驗證到流片,僅用一年半的時間。

根據現場演示,杭州城市大腦實時處理主城區交通,需用40顆傳統GPU,延時為300ms,單路視頻功耗2.8W;而使用含光800僅需4顆,延時降至150ms,單路視頻功耗1W,有效節約了硬件和時間成本。

由於AIoT市場碎片化,端側芯片性能、存儲、功耗等要求都不相同,比如就本次新發的芯片中,雲天勵飛採用的是玄鐵高端處理器,需1GB以上存儲;清微智能在其可重構芯片中採用的是中端處理器玄鐵804/805,存儲需400-500MB;炬芯重點在低功耗、好聲音,選擇的是高能效處理器,它對性能和品質要求更低,存儲只要200-300MB。孟建熠表示,不是說存儲小就代表差,而是在行業中追求的產品不同,玄鐵面向不同AIoT的系列化產品,有兩代產品,一代是玄鐵老的自主架構,第二代是RISC-V。炬芯過去使用的是MIPS,炬芯科技董事長CEO周正宇說,改用RISC-V還是有些緊張的,但經過實踐,如今他們已有4款芯片用玄鐵802、1款芯片使用玄鐵803。周正宇發現,RISC-V在工具鏈、指令集使用上已超過MIPS,更接近Arm;其功耗、壓縮率上也比MIPS更好。除了提供通用CPU,平頭哥還專門為炬芯打造特別指令集,周正宇表示,雙方會更長期的合作。奉加微今年年初獲得平頭哥玄鐵802 MCU、YoC操作系統及CSI外設接口授權,用6個月就完成了芯片設計,艾派克預計今年搭載平頭哥內核的芯片出貨量將達到2億顆。

去年9月,阿里以非洲蜜獾的外號「平頭哥」為名成立平頭哥公司。

定位端雲一體,全棧產品雛形已現

2、含光的業務定位與算法通用性含光800中集成了達摩院算法,深度優化CNN網絡及視覺DNN模型,有效提升了視覺計算效率。驕暘介紹了第一顆NPU的業務定位,CNN類模型推理加速為主,通用可擴展到其他DNN模型,主要應用於數據中心、大型端上。例如,阿里的業務中,城市大腦、工業大腦、圖像視頻審核、圖像視頻標註、圖文搜索等擅長基於CNN的算法加速,搜索推薦、廣告、語音客服、自動翻譯等則通用其他DNN模型。談及芯片架構能否適配新的算法,驕暘舉了個例子。他說,當初芯片設計時,主要對CNN網絡做加速,等芯片回來后,他看到做諸如流行趨勢分析、智能服裝設計、流行的網絡視頻換臉遊戲等的一些業務,用到生成式對抗網絡(GAN)等算法。

阿里巴巴CTO張建鋒表示,阿里巴巴有足夠信心和能力,去做傳統硬件公司能做到的硬件,和不能做到的軟件變硬件。他強調,阿里的軟件和算法,是其最大的傳統優勢。這一雄心壯志背後的底氣,是阿里雲的AI驗證場景、達摩院的算法、阿里硬件基礎設施多年的技術沉澱。1、AI與雲計算催生豐富場景阿里巴巴造芯的天然優勢,正在於擁有極其豐富的AI應用場景。經過十年的發展,阿里在AI和雲計算領域均已躋身全球前列。阿里雲更是穩居全球雲計算廠商前三、亞太第一的位置,為超過一半的中國A股上市公司和80%中國科技類企業提供雲服務。阿里經濟體橫跨電商、金融、物流、雲計算、大數據、全球化等場景,用戶規模龐大,圖像視頻分析、搜索、推薦、網絡等各種業務場景都亟待AI專用芯片,其中圖像和視頻對算力的需求尤其大,這為平頭哥研發AI芯片提供了絕佳平台。2、沉澱19年的硬件實力儘管平頭哥才成立一年,其硬件能力的積累可遠遠不止一年。平頭哥由中天微和達摩院自研芯片業務整合而成,算上中天微的19年,以及阿里巴巴在服務器、FPGA以及存儲等硬件基礎設施上早年的摸索,這些經年累月的研發經驗使其在體繫結構、編譯技術等領域擁有深厚的技術儲備。芯片設計流程複雜、風險極高。一旦流片失敗,一切都要推倒重來,很多芯片公司做不到一次流片成功;流片成功后還需經過複雜的測試驗證,只有各項指標均符合實際場景需求,才到了真正的商用階段。而平頭哥完成芯片設計、流片等全過程用時非常短,7個月完成前端實際,之後僅3個月就一次成功流片,這在業界還是非常難得的。3、與達摩院算法高度適配除適配場景、硬件架構外,AI芯片的差異化設計還體現在軟件算法,它與硬件架構高度適配、協同創新,才能發揮出芯片的最大價值。算法方面,阿里巴巴達摩院機器智能實驗室過去兩年構建了完整的算法體系,涵蓋語音智能、語言技術、機器視覺、決策智能等方向,並且取得多個世界領先水平的成果,在國際頂級學術會議上共發表了近400篇頂級論文。基於這些能力,算法和硬件之間的鴻溝得以突破。

AI芯片是人工智能場景最高效的算力單元,阿里將投入重金打造好這些技術,同時構建應用生態。除此之外,平頭哥還將繼續開發操作系統,軟硬件融合的算法,核心的IP等,把這些共性的技術做好、做精、做出競爭力,並形成生態,然後開放給芯片設計公司,讓他們基於高質量的基礎設施打造芯片產品,從而催生產業生態的繁榮,提升整體的產業競爭力。

1顆含光800=10顆圖像GPU

集結平頭哥陣營,大曬生態實力

看點:含光出鞘背後,看平頭哥的生態籌碼。

平頭哥研究員孟建熠說,玄鐵更重要的是在基礎架構之上的可擴展性,能在原有的一些通用處理器上,定製一些差異化的東西。2、一站式芯片設計平台無劍SoC平台集成CPU、GPU、NPU等,可降低芯片設計門檻,將研發周期縮短50%,開發成本降低50%。目前,無劍已推出MCU、語音、視覺三大平台,後續還會有更多平台推出。MCU平台有5類IP,3家合作夥伴;語音識別平台有8類IP,3家合作夥伴;機器視覺平台有9類IP,3家合作夥伴。除了它們各自擁有的一些差異化創新技術外,平頭哥為所有平台雲端一體保持全鏈安全。

阿里的武俠情結,已經延續到芯片中。阿里巴巴2019雲棲大會開幕首日,平頭哥發佈阿里巴巴第一款芯片含光800,號稱全球性能最強的雲端AI推理芯片,性能及能效比均全球第一。含光,正是《列子·湯問》中孔周三大神劍之一。至此,平頭哥集齊AI芯片(含光800)、高性能處理器IP(玄鐵系列)和一站式芯片設計平台(無劍SoC平台),端雲一體全棧芯片產品家族的雛形已然顯現。阿里巴巴CTO張建鋒說,含光芯片是萬里長征的第一步,阿里今後會成為一家真正軟硬件一體化協同發展的科技公司。不過,主論壇僅簡介含光芯片的性能,芯片的詳細參數、頂層架構設計圖、阿里關於芯片布局的思考等細節,都在當天下午的分論壇上一一揭曉。在雲棲大會首日下午的平頭哥生態論壇上,平頭哥陣營首次亮相,不僅大秀產品進展,官宣IP聯盟和發佈《雲端設計白皮書》,還攜手清微智能、雲天勵飛、炬芯、奉加微、聯盛德、艾派克、博雅鴻圖等公司連發7款基於玄鐵處理器的芯片。當日,天貓精靈與平頭哥合作研發的智能語音芯片也正式發佈,將用於即將推出的天貓精靈音箱中。會後,平頭哥研究員孟建熠,平頭哥AI芯片負責人驕暘,清微智能首席科學家、清華大學微電子所副所長尹首一教授,雲天勵飛研發副總裁李愛軍,炬芯科技董事長CEO周正宇等接受智東西等媒體的採訪,對含光芯片的核心優勢,它在微架構設計上做的創新,平頭哥三大產品系列的進展、未來計劃和生態構建等問題一一予以解答。

平頭哥的造芯優勢:場景、軟件、硬件

眾所周知,服務器領域x86陣營獨大,Arm陣營則是移動芯片時代的主角。如今,平頭哥帶着它的平頭哥陣營來了。目前,平頭哥的玄鐵系列處理器和無劍平台已擁有100多家客戶。在平頭哥分論壇上,清微智能、雲天勵飛、炬芯、奉加微、聯盛德威、艾派克、博雅鴻圖等企業發佈7款基於玄鐵處理器IP的新款芯片,涵蓋視覺、語音、微控制、無線芯片等應用領域。這其中,炬芯是國內老牌IC設計企業,雲天勵飛是國內知名AI獨角獸,艾派克是中國打印機主控芯片的龍頭,奉加微是藍牙芯片領域的新秀,清微智能、聯盛德、博雅鴻圖則分別在AI可重構計算芯片、物聯網通信芯片、數據視網膜芯片領域各有專長。

具體而言,含光芯片在架構設計中主要做了如下優化方向:(1)大大減少內存帶寬,每次內存訪問會造成較大功耗損失,平頭哥自研架構將計算單元放在離存儲很近的位置,高密度的計算和存儲可大幅減少對內存的訪問,在保證高性能的情況下,將芯片功耗降到最低水平。(2)組合算子優化融合,對算法網絡深入調節,單位對內存、片上寄存器的訪問更加精簡,將計算效率、能源利用效率提升至較高水準。基於馮·諾依曼架構的傳統通用處理器,存儲和運算分離,做大量讀寫操作時會遇到帶寬瓶頸,效率受限。含光800根據神經網絡推理運算特徵,設計特定的硬件神經元、高速連接的存儲結構以及專用指令集,對內存和計算單元實現高效組織管理,實現單條指令完成多個操作,提高計算效率和內存訪問效率。(3)算法壓縮,採用稀疏、量化等推理加速技術,以及密集壓縮的計算、存儲、流水線技術,有效解決芯片性能瓶頸問題。除了INT8/INT16 量化加速外,也覆蓋FP16/BFP16的向量計算。比較突出的一點是基本實現全網絡量化,所有數據存儲按照比較壓縮的形式,計算過程根據精度要求把數據做拓展,保持其較高精度,存儲單元時則變成較壓縮的格式。(4)計算中高度并行處理,含光芯片深度優化CNN及視覺類算法,不僅加速矩陣乘法、交換機,支持反卷積、空洞卷積、3D卷積、插值、ROI等,還可加速向量計算、激活函數等運算,這些優化均有效提高其計算能力和效率。

無劍的主要原理是讓行業軟硬件很好融合。現在芯片的設計方法是將買IP、模塊,自己做組合、驗證、測試、流片;而無劍更多在共性基礎上從維持生態的角度去做事,先把硬件上共性的東西都做好,在系統層面也做了芯片的試流片。玄鐵系列處理器IP和無劍SoC平台均已服務多家芯片企業及AI企業。3、AI芯片在雲端,阿里雲目前排名全球前三、亞太第一,這為平頭哥服務企業提供了絕佳平台,含光800通過AI雲服務為各企業的AI場景提供極致算力。在AI場景中,含光800是異構計算的很好補充。據悉,未來其產品形態還會進一步完善,包括雲端AI訓練芯片和端側AI推理芯片,平頭哥還在研發用於阿里雲神龍服務器的SoC專用芯片,以滿足更多場景的算力需求。

含光800採用台積電12nm製程工藝,含170億晶體管,支持PCIe 4.0和單機多卡,今年第四季度開始量產。在芯片測試標準平台Resnet 50上,含光800的具體分數為:每秒處理78563張圖片,能效比達500 IPS/W。

今日关键词:济南双胞胎白狮