30 มิ.ย. 2554 - Llano, เป็นชิปตัวที่สองในตระกูล Fusion ที่รวม CPU และ GPU อยู่บน die เดียวกัน, เปิดตัวเมื่อต้นเดือนนี้ได้รับการ review ออกมาดีพอควร. แต่ตอนนี้, ได้รู้ถึงรายละเอียดเล็กๆ น้อยๆ เกี่ยวกับ AMD นำ CPU และ GPU ไปรวมกันบน die ของ Llano จริงๆ อย่างไร
David Kanter จาก RealWorldTech ได้ทำการศึกษาและรวบรวมเพื่อวิเคราะห์ในเชิงลึกเกี่ยวกับ Llano, เปรียบเทียบการรวม CPU/GPU ของมันกับ Intel Sandy Bridge. คำตอบส่วนหนึ่งของ Kanter ตอบคำถามเกี่ยวกับ Llano ที่ได้รับการยกย่องโดย review ต่างๆ
นอกจากตัว CPU core ที่ไม่แข็งของมันแล้ว, จุดอ่อนหลักของ Llano ที่ review ได้เน้นคือเรื่องที่ GPU core นั้นถูกจำกัดโดย memory bandwidth อย่างมาก. Cypress GPU ที่ถูกใช้ใน Llano ถูกออกแบบมาให้เป็นการ์ดจอแยก, ที่มันควรจะได้ access ไปยังพื้นที่ขนาด 1 GB หรือ 2 GB ที่เชื่อต่อด้วย bandwidth ความเร็วสูง, GDDR memory ของมันโดยเฉพาะ. บน Llano, ในทางตรงกันข้าม, GPU ใช้ main memory ร่วมกับ CPU, และผลที่ได้คือประสิทธิภาพติดปัญหาคอขวดอย่างรุนแรง. บทความของ Kanter ให้รายละเอียดว่าทำไมมันถึงเกิดขึ้น
แทนที่จะเชื่อม CPU และ GPU ของ Llano ด้วย ring bus ความเร็วสูงและให้มันใช้ L3 cache ร่วมกัน (วิธีของ Sandy Bridge), AMD ปล่อยให้ทั้งสองส่วนนี้ไม่ได้ต่อเข้าด้วยกันอยู่ภายใน. เลือกที่จะให้, CPU และ GPU ใช้ main memory เพื่อสื่อสารกันโดยไม่ได้ copy ข้อมูลจากที่หนึ่งไปยังอีกที่หนึ่ง. ตอนเปิดเครื่อง, GPU สามารถเข้าถึง 512 MB ของ main memory ใน memory ที่ว่างออกมาต่างหาก; CPU ได้ที่เหลือของ RAM ไป.
ภายใน, มันมี bus 2 ทิศทางเล็กๆ ที่เชื่อม GPU ไปยังกลุ่มของ memory queue, และยังมี bus เชื่อมต่อ GPU ไปยัง DDR controller; แต่มันเป็นอย่างนั้น. CPU พูดคุยกับ GPU โดยใช้ graphics driver และ main memory, และ GPU คุยกับ CPU โดยการ request ไปยังพื้นที่ memory เฉพาะ, ซึ่งอันหลังนี้ทำงานช้าพอสมควร
ในทั้งหมด, แล้ว, การขาด bandwidth ความเร็วสูงภายในระหว่าง CPU และ GPU, และการต้องพึ่ง main memory สำหรับการสื่อสาร, หมายความว่าความสามารถด้านกราฟฟิกของ Llano ถูกบีบจำกัดโดย dual-channel DDR3 controller อย่างมาก.
เพื่ออนาคตของ Llano, ผมได้เสนอ AMD ให้พิจารณาให้มี eDRAM เพื่อให้ CPU และ GPU ใช้สำหรับเป็น shared memory และพูดคุยกันบน die, แต่ Kanter เสนอทางเลือกอื่นที่น่าสนใจกว่าสำหรับเพิ่มประสิทธิภาพด้านกราฟฟิกใน Fusion รุ่นต่อไป: ใช้เทคนิคการสร้างชิปแบบ 3D เพื่อใส่ memory จำนวนหนึ่งลงไปในชิปเดียวกัน. ปริมาณของ memory ไม่น่าจะมากซักเท่าไหร่ - อาจแค่ 256 MB ที่มี bandwidth ความเร็วสูง, latency ต่ำ ซึ่งนั่นจะเร่งประสิทธิภาพของ Llano ขึ้นได้อย่างมาก
ทั้งหมดทั้งสิ้น, นี่ก็เป็นอีกครั้ง, แสดงให้เห็นถึงขนาดของอุปสรรคที่บีบคั้น NVIDIA อยู่, และทำไมบริษัทเลือกที่จะบุกตลาด desktop ด้วย Project Denver. Sandy Bridge และ Fusion ได้ร่ายมนต์บทเริ่มต้นของจุดจบของตลาด GPU แยก, ที่ซึ่ง NVDIA ยังคงครองตลาดอยู่
source: http://arstechnica.com/business/news/2011/06/another-look-at-amds-llano.ars
ไม่มีความคิดเห็น:
แสดงความคิดเห็น