
HSA特色介紹 |
其實從去年Richland推出之前,AMD就已經開始在推廣HSA這個架構設計,直到APU 13開發者大會上,才真正看到更多廠商加入HSA應用開發。而這次新推出的Kaveri APU,也正式目前市面上第一款採用HSA架構設計的APU產品。所謂的HSA架構,其實全名是為Heterogeneous System Architecture,其中主要有兩項重點技術,一個是可以實現CPU與GPU共用系統記憶體的hUMA技術,另一個便是能夠讓應用程式直接發指令給GPU來進行運算處理的hQ(Heterogeneous Queuing)技術。

以往CPU和GPU在執行運算作業時,通常都會先將處理好的資料暫存到各自的快取記憶體上,接著再透過匯流排來傳遞資料。而這次HSA中的hUMA技術,則是讓CPU和GPU可直接共用系統記憶體,這樣一來就能夠省去匯流排傳遞的步驟,達到加速運算的效果。
至於hQ技術的部分,因為一般的應用程式在執行時,若是想要透過GPU來加速,因為程式語言的不同,多半得先發指令到CPU上,在由CPU將指令傳送到作業系統、接著再經過驅動程式以及編譯器之後,GPU才有辦法開始執行作業。雖然說這樣的運算架構還是可以達到一些GPU加速的效果,但因為需要經過太多層步驟,所以一來對於軟體開發不容易,二來也沒法讓GPU運算能力完全發揮。所以HSA中所提出的hQ技術便是可以讓支援HSA架構的應用程式,直接發指令給GPU來執行運算作業,因此而達到最佳的加速效果。

從底下的是意圖來看,便能夠快速瞭解到,透過透過HSA架構的處理器以及支援HSA的OpenCL2.0程式碼,在執行作業時,便可以同時使用CPU與GPU來進行運算,並達到更快速的運算效能。

AMD Kaveri APU規格介紹 |
AMD這次推出的Kaveri APU除了改用了HSA架構之外,在製程方面,也終於從原本的32奈米推進到28奈米。而其中的CPU處理器部分,則是搭載了兩個Steamroller壓路機處理器模組。這次的模組架構跟先前的Piledriver打樁機模組並沒有太大的差異,在每個模組之中,同樣都包含了兩個運算核心,且每個核心也都具備了獨立的Integer scheduler整數運算調度單元和L1快取記憶體,並共享一個FP scheduler (Floating Point scheduler浮點運算調度單元)和2MB的L2快取記憶體。所以具備兩個壓路機模組的Kaveri APU,便具有4個運算核心以及4MB的L2快取記憶體。

而在GPU繪圖核心的部分,這次最大的改變就是採用了GCN的架構,並且也終於改用了PCIe 3.0傳輸介面。而這次的Kaveri APU中,最多則會具備8個GCN運算模組,而且其中的繪圖晶片,也會跟AMD的桌上型顯示卡一樣,改為Radeon R7 Graphics來作為命名方式。

除了核心架構上的改進之外,針對多媒體解碼的部分,這次也加入了VCE2編碼引擎和UVD4影像解碼技術。其中的VCE2相較於之前的VCE1,主要是為了Wireless Display無線影像傳輸功能,新增了H.264 YUV444的編碼支援。

至於UVD4影像解碼技術的部分,其實沒有太大改變,主要是在H.264/AVCHD解碼的部分多了一個錯誤回復的支援。

先前的APU因為繪圖晶片架構設計的關係,在對於Dual Graphics功能的支援上,始終只能夠支援到Radeon HD 6000系列的中低階顯示卡,不過,這次改採用了GCN架構之後,Dual Graphics功能也終於能夠支援Radeon R7系列的獨立顯示卡。至於能夠支援的顯示卡清單,目前AMD還沒有正式公布,而且也得在13.35版的驅動程式之後,才會將這項功能正式更新。但就目前官方提供的測試資料來看,搭配Dual Graphics功能之後,竟有95%的效能提昇,看起來是還蠻讓人期待的數據。

另外,針對記憶體支援方面,這次新推出的Kaveri APU則是可以支援到DDR3-2400的記憶體,而且在自家的記憶體產品命名方式,也將會跟桌上型顯示卡一樣,依照等級的不同改用Radeon R9、R7以及R5系列來命名型號。

由於Kaveri APU整體架構設計有著蠻多改變,因此在APU的封裝腳位也改為新的FM2+設計,而這也說明了,這次的Kaveri APU並無法向下相容於先前的FM2腳位設計的主機板。必須要搭配採用FM2+腳位的A88、A78以及A55等晶片組主機板一起使用。

目前AMD在Kaveri APU的產品線上,則是會先針對桌上型平台推出A10-7850K、A10-7700K以及A8-7600等三個新款APU。其中的A10-7850K是最高階的一款,一共具備了4個CPU處理核心以及8個GCN繪圖模組。其預設的CPU核心運作時脈為3.7GHz,並可依照核心數量使用的不同,透過Turbo Core技術自動調昇時脈至最高4.0GHz的運作時脈。然而從型號上的K也可以知道,這款APU也是不鎖倍頻的設計,讓想要超頻的使用者可以比較彈性地調整運作時脈。而在繪圖晶片的部分,則是將預設的運作時脈設定在720MHz。至於APU整體供電規格則是為95瓦。
同樣屬於A10系列的A10-7700K,跟A10-7850K主要的不同則是在於GCN模組數量改為6個,並且亦將預設的核心時脈降到3.4GHz,不過一樣是不鎖倍頻的設計。再來看到A8-7600的部分,將會有65瓦和45瓦兩個不同供電規格的版本,因此在預設的核心運作時脈也會有所差異。

最後放上一張規格重點整理,希望可以幫助大家快速瞭解這次Kaveri APU的一些改進。

實際測試 |
這次的Kaveri APU測試則是借來了最高階的A10-7850K,並且重新測試了上一代的A10-6800K,好讓網友們可以一起做個比較。而這次一樣也會將各個測試結果整理成圖表,讓大家可以比較方便觀看數據結果。另外,要特別說明一下的是,因為Kaveri APU已經可以支援到DDR3-2400的記憶體,所以為了讓效能有更好的呈現,這次搭配了DDR3-2400的記憶體來進行測試。不過,因為上一代的Richland APU只有支援到DDR3-2133,但為了要讓記憶體運作狀況可以一致,所以這邊則是利用超頻的方式將記憶體運作時脈提昇到DDR3-2400。至於底下的清單,則是這次用來測試個各項零組件,給網友們做個參考囉!
處理器:AMD A10-6800K、AMD A10-7850K
主機坂:ASRock F2A88X Extreme6+
硬碟機:美光M500 120GB固態硬碟
記憶體:AMD DDR3-2400 4GBx2
電源供應器:技嘉ODIN 1200W
作業系統:Windows 7 SP1 旗艦版
驅動程式:13.30 Beta 11
==============================================================================
這次AMD Kaveri APU的大小跟上一代的Richland APU一樣,不過Kaveri的封裝腳位則是改為FM2+,比FM2要多了兩根針腳。

左邊為A10-7850K,右邊為A10-6800K。

AMD A10-7850K的CPU-Z軟體資訊

處理器效能測試 |
BaseMark CL 1.1軟體測試
在物理測試項目時,A10-7850K為64.7分、A10-6800K為36.38分。
在碎形測試項目時,A10-7850K為277.38分、A10-6800K為158.11分。
在圖像測試項目時,A10-7850K為69.62分、A10-6800K為55.58分。
在影像測試項目時,A10-7850K為128.99分、A10-6800K為106.02分。
測試結果總分,A10-7850K為86.17分、A10-6800K為55.55分。

CINEBENCH R11.5軟體測試
A10-7850K單核心、多核心效能、MP比以及OpenGL測試結果分別為92cb、310cb、3.36x以及41.52fps。
A10-6800K單核心、多核心效能、MP比以及OpenGL測試結果分別為96cb、321cb、3.36x以及43.13fps。


Nuclearus Multi Core v2.0軟體測試
測試結果A10-7850K總分為13713分、A10-6800K總分為12750分。

SiSoftware Sandra軟體測試
在Processor Arithmetic(算數處理器)項目測試部分,A10-7850K的效能總評結果為52GPOS、
A10-6800K結果為43.45GPOS。

GPGPU運算項目測試部分,A10-7850K的效能總評結果為540MPixel/s、A10-6800K的結果為239MPixel/s。

GPGPU加密效能測試部分,A10-7850K的效能總評結果為7.32GB/s、A10-6800K結果為3.53GB/s。

視訊渲染效能測試部分,A10-7850K的效能總評結果為204.16MPixel/s、A10-6800K的結果為93.77MPixel/s。

wPrime軟體測試
A10-7850K在32MB選項的測試結果為13.338秒,在1024M選項的測試結果為416.739秒。
A10-6800K在32MB選項的測試結果為17.306秒,在1024M選項的測試結果為536.607秒。


繪圖處理器效能測試 |
3DMark軟體測試
在Fire Strike Extreme場景測試中,A10-7850K測試結果分數為659分、A10-6800K為510分。

在Fire Strike場景測試中,A10-7850K測試結果分數為1458分、A10-6800K為1100分。

在Cloud Gate場景測試中,A10-7850K測試結果分數為7007分、A10-6800K為6485分。

在Ice Storm場景測試中,A10-7850K測試結果分數為68425分、A10-6800K為68467分。

Unigine Heaven 4.0繪圖效能測試軟體
在解析度1920x1080時,關閉反鋸齒與開啟4XAA的每秒平均張數結果,A10-7850K分別為9.6FPS、7.7FPS、A10-6800K分別為6.6FPS、5.6FPS。

Unigine Valley繪圖效能測試軟體
在解析度1920x1080時,關閉反鋸齒與開啟4XAA的每秒平均張數結果,A10-7850K分別為11.7FPS、8.6FPS、A10-6800K分別為11.1FPS、7.9FPS。

遊戲效能測試 |
大地長征之好戲登場Dirt Showdown遊戲測試
在解析度1920x1080且特效全開時,關閉反鋸齒與開啟4XAA的每秒平均張數結果,A10-7850K分別為23.54FPS、23.26FPS、A10-6800K分別為26.54FPS、24.35FPS。

太空戰士14-AREALM REBORN遊戲測試
解析度為1920x1080並開啟最高效果設定時,A10-7850K測試結果為1808分、A10-6800K為1627分。

勇者鬥惡龍遊戲測試
解析度為1920x1080並開啟最高效果設定時,A10-7850K測試結果為5095分、A10-6800K為5021分。

戰地風雲四遊戲測試
解析度為1920x1080,且特效選項為中等時,A10-7850K的每秒遊戲張數的測試結果為29.76FPS、A10-6800K為22.54FPS。

榮譽勳章之鐵血悍將遊戲測試
解析度為1920x1080,且特效選項為中等時,A10-7850K的每秒遊戲張數的測試結果為24.93FPS、A10-6800K為20.08FPS。

系統效能測試 |
PCMark 8系統測試
在Home項目測試中,A10-7850K測試結果分數為3655分、A10-6800K為3388分。
在Creative項目測試中,A10-7850K測試結果分數為3855分、A10-6800K為3293分。

實際功耗測試 |
A10-7850K在待機狀態時,系統總功耗大約是63瓦左右;當處理器滿載時,系統總功耗則為118瓦;當處理器與繪圖晶片皆滿載時,系統總功耗大約會在138瓦左右。
A10-6800K在待機狀態時,系統總功耗大約是59瓦左右;當處理器滿載時,系統總功耗則為146瓦;當處理器與繪圖晶片皆滿載時,系統總功耗大約會在175瓦左右。

測試總結
先看到耗電量測試方面,這次的Kaveri APU無論是CPU滿載或是CPU+GPU滿載的狀態,耗電量比上一代的APU要低了許多,看來製程的改進讓Kaveri APU的耗電量表現改進不少。
再來看到效能表現方面,從各項測試結果來看,這次Kaveri APU在大部分的測試都有比上一代的Richland APU要好一點,特別是在GPGPU的測試部分,效能有著近一倍的提昇幅度,而且在wPrime的測試中,亦比Richland APU快了將近20%左右的效能,算是APU產品這幾次更新以來,比較有感的增進。這樣看來的話,若是之後真的能夠有更多支援HSA架構的應用軟體,相信應該可以讓Kaveri APU有更多的應用。
至於繪圖晶片測試部分,3DMark的測試結果是最為明顯,大約成長了30%左右,不過其它遊戲方面提升幅度就比較有限,大約只有5~10%左右的增加,效能倒是沒有太大的差異,稍稍可惜一點,或許等到更多遊戲導入Mantle之後,會有比較明顯的提昇吧!
小惡魔好康時間 |
為了感謝大家耐心看完這篇有點生硬的APU實測文章,這次也準備一個是可以用來當作手機架的鑰匙圈,以及一個2200毫安培的行動電源,要來讓大家抽獎囉!



1. 活動辦法:只要回應內容與文章相關都可以抽獎喔
2. 回文時間:即日起到2014/01/21 23:59為止
3. 抽獎獎品:手機架的鑰匙圈(一名)、行動電源(一名)
==============================================================================
中獎名單公布
AMD手機架鑰匙圈得獎人:paulwang
AMD行動電源得獎人:meimei009
中獎者會由活動小組發出通知,再請於一週內回覆收件資料喔!