AI có khả năng lý luận sẽ phá vỡ sự thống trị chip AI của Nvidia?
09:03 12/03/2025
Kinh tế Sài Gòn Online
Sự trỗi dậy của các mô hình trí tuệ nhân tạo lý luận (reasoning) đòi hỏi các loại chip AI chuyên biệt và hiệu quả hơn. Điều này giúp mở ra cơ hội để các đối thủ giành thị phần chip AI mà hãng Nvidia đang độc chiếm hiện nay.
Sự trỗi dậy của các mô hình AI lý luận đang mở ra không gian cạnh tranh mới để các statup sản xuất chip như Cerebras và Groq (Mỹ) phá vỡ sự thống trị chip AI của Nvidia mà CEO Jensen Huang đang nỗ lực củng cố. Ảnh: FT/Bloomberg
Nhu cầu suy luận sẽ điều khiển cuộc chơi chip AI
Các mô hình AI lý luận (reasoning models) như R1 của DeepSeek (Trung Quốc), o3 của OpenAI và Claude 3.7 của Anthropic (Mỹ) tiêu thụ tài nguyên điện toán nhiều hơn các hệ thống AI trước đây. Điều này là do khi trả lời yêu cầu (prompt) của người dùng, mô hình cần sử dụng một quá trình gọi là suy luận (inference) để giải quyết vấn đề theo từng bước hoặc hiểu mối quan hệ phức tạp giữa các yếu tố.
Quy trình suy luận dự kiến sẽ trở thành một phần lớn hơn trong nhu cầu về công nghệ AI khi các cá nhân và doanh nghiệp tăng cường sử dụng với các ứng dụng AI vượt ra ngoài các chatbot phổ biến hiện nay, chẳng hạn như ChatGPT của OpenAI hoặc Grok của xAI.
Đây chính là không gian mới để các đối thủ cạnh tranh tìm cách phá vỡ sự thống trị chip AI của Nvidia, từ các công ty khởi nghiệp (startup) sản xuất chip AI của Mỹ như Cerebras và Groq đến các bộ xử lý tăng tốc tùy chỉnh của các tập đoàn công nghệ lớn như Google, Amazon, Microsoft và Meta.
“Đào tạo dữ liệu giúp xây dựng các mô hình AI còn suy luận sử dụng các mô hình có sẵn này. Hiện nay, việc sử dụng AI đang tăng vọt. Vì vậy, cơ hội hiện để tạo ra một con chip tối ưu hơn cho mục đích suy luận so với mục đích đào tạo là lớn hơn nhiều so với trước đây”, Andrew Feldman, CEO Cerebras nói.
Chip AI của Cerebras đang được Mistral, startup AI của Pháp sử dụng để tăng tốc hiệu suất của chatbot Le Chat. Tháng 9 năm ngoái, Cerebras đã nộp hồ sơ chào bán cổ phần lần đầu ra công chúng (IPO) lên Sở chứng khoán và sàn giao dịch Mỹ. Các nguồn tin cho biết, công ty đặt mục tiêu huy động đến 1 tỉ đô la Mỹ dựa trên mức định giá từ 7-8 tỉ đô la.
Cũng trong năm ngoái, Cerebras ra mắt dịch vụ Cerebras Inference, cung cấp khả năng suy luận AI “nhanh nhất thế giới”. Cerebras Inference sử dụng kiến trúc phần cứng độc đáo, cụ thể là Wafer Scale Engine (WSE), loại chip kích thước lớn hơn nhiều so với các bộ xử lý đồ họa (GPU) truyền thống.
Trong khi đó, startup Groq chuyên phát triển các chip tăng tốc AI, được thiết kế để tối ưu hóa hiệu suất suy luận AI.
Chip AI của Nvidia đang thống trị thị trường trung tâm dữ liệu AI. Thế nhưng, nhà đầu tư đang tự hỏi liệu Nvidia có thể tiếp tục bán chạy chip AI hơn các đối thủ cạnh tranh tại các trung tâm dữ liệu nhỏ hơn nhiều đang được xây dựng và sẽ tập trung vào suy luận.
Vipul Ved Prakash, CEO kiêm đồng sáng lập Together AI, một nhà cung cấp dịch vụ đám mây tập trung vào AI, cho biết suy luận là “trọng tâm lớn” đối với doanh nghiệp của ông. Tháng trước, Together AI chốt thành công vòng gọi vốn dựa trên mức định giá 3,3 tỉ đô la.
“Tôi tin rằng, việc vận hành trung tâm dữ liệu suy luận AI ở quy mô lớn sẽ là khối lượng công việc lớn nhất trên Internet tại một thời điểm nào đó trong tương lai”, ông nói.
Các nhà phân tích của ngân hàng Morgan Stanley ước tính, hơn 75% nhu cầu về điện năng và tính toán ở các trung tâm dữ liệu tại Mỹ dành cho suy luận trong những năm tới.
Điều đó có nghĩa là hàng trăm tỉ đô la tiền đầu tư có thể chảy vào các trung tâm dữ liệu suy luận AI trong vài năm tới, nếu nhu cầu sử dụng AI tiếp tục tăng trưởng với tốc độ hiện tại.
Trong khi đó, theo ước tính của các nhà phân tích ở ngân hàng Barclays, chi phí đầu tư vốn cho suy luận trong các hệ thống AI lớn nhất và tiên tiến nhất sẽ vượt quá chi phí đào tạo AI trong 2 năm tới, tăng từ 122,6 tỉ đô la trong năm 2025 lên 208,2 tỉ đô la vào năm 2026.
200 tỉ đô la doanh thu mở ra cho các đối thủ của Nvidia
Nvidia gần như độc chiếm 100% thị phần chip AI phục vụ mục đích đào tạo các hệ thống AI tiên tiến. Tuy nhiên, Barclays dự đoán, công ty này chỉ phục vụ 50% thị phần điện toán suy luận trong dài hạn. Điều đó sẽ mở ra nguồn doanh thu chip tiềm năng 200 tỉ đô la cho các đối thủ của Nvidia vào năm 2028.
“Có một sức hút lớn đối với những con chip tốt hơn, nhanh hơn và hiệu quả hơn” Walter Goodwin, người sáng lập startup sản xuất chip Fractile (Anh) nói và lưu ý thêm, các nhà cung cấp dịch vụ điện toán đám mây đang mong muốn loại bỏ sự phụ thuộc quá mức vào chip AI của Nvidia.
CEO Nvidia, Jensen Huang khẳng định, chip của công ty này có khả năng suy luận cũng mạnh mẽ như khả năng đào tạo AI.
Chip Blackwell mới nhất của Nvidia được thiết kế để xử lý suy luận tốt hơn. Nhiều khách hàng đang sử dụng chip Blackwell để phục vụ các ứng dụng AI thay vì đào tạo các hệ thống AI. Sản phẩm này đang là rào cản lớn cho các đối thủ cạnh tranh.
Chi phí cung cấp phản hồi từ các mô hình ngôn ngữ lớn (LLM) giảm nhanh chóng trong 2 năm qua, nhờ sự kết hợp của các chip mạnh hơn, hệ thống AI hiệu quả hơn và sự cạnh tranh gay gắt giữa các nhà phát triển AI như Google, OpenAI và Anthropic.
Theo Sam Altman, CEO OpenAI, chi phí sử dụng một cấp độ AI nhất định giảm khoảng 10 lần sau mỗi 12 tháng.
Sự xuất hiện các mô hình V3 và R1 của DeepSeek gây ra sự hoảng loạn trên thị trường chứng khoán Mỹ hồi tháng 1. Các đổi mới về kiến trúc và hiệu quả mã lập trình của công ty khởi nghiệp Trung Quốc này đã giúp giảm chi phí đào tạo các mô hình này, giúp giảm chi phí suy luận.
Trong khi đó, kiểu xử lý dữ liệu mà các tác vụ suy luận yêu cầu, có thể cần bộ nhớ lớn hơn nhiều để trả lời các truy vấn dài hơn và phức tạp hơn, mở ra cánh cửa cho các giải pháp thay thế cho GPU của Nvidia, vốn có điểm mạnh là xử lý khối lượng lớn các phép tính tương tự nhau.
Nvidia khẳng định, hiệu suất suy luận của các GPU đã cải thiện gấp 200 lần trong 2 năm qua. Hiện nay, có hàng trăm triệu người dùng truy cập các sản phẩm AI thông qua hàng triệu GPU của công ty.
“Kiến trúc GPU của chúng tôi có thể thay thế và dễ sử dụng theo nhiều cách khác nhau, cho cả việc xây dựng các mô hình lớn hoặc cung cấp các ứng dụng AI theo những cách mới”, Jensen Huang, CEO Nvidia nói trong cuộc họp báo hồi tháng trước.
Tổng thống Donald Trump mới đây đã biến bãi cỏ phía Nam của Nhà Trắng thành một showroom tạm thời của Tesla, thể hiện sự ưu ái rõ ràng dành cho cố vấn của mình, tỷ phú Elon Musk, CEO của hãng xe này.
Khoản đầu tư này hướng đến việc triển khai nền tảng Agentforce, giúp nâng cao năng suất lao động và hỗ trợ các doanh nghiệp tận dụng AI để tăng trưởng.
Liên minh châu Âu (EU) đã đề xuất kế hoạch áp đặt thuế lên 26 tỷ Euro (28.3 tỷ USD) hàng hóa của Mỹ nhằm đáp trả hàng rào thuế quan thép và nhôm của ông Trump.
Doug Ford, thủ hiến tỉnh Ontario của Canada, đe dọa "cắt hoàn toàn" nguồn cung điện của 1,5 triệu người Mỹ nếu ông Trump tăng phụ phí điện nhập khẩu lên 25%.
Khi Tổng thống Mỹ Donald Trump khởi động cuộc chiến thương mại mới với Trung Quốc, nhiều nhà phân tích cho biết ông sẽ có biện pháp mạnh mẽ hơn so với nhiệm kỳ đầu.
Video đính kèm trong bài đăng cho thấy Tổng thống Mỹ Donald Trump ngồi trong Phòng Bầu dục và trò chuyện với Chủ tịch FIFA Gianni Infantino đang đứng bên cạnh.
Ukraine đồng ý ngừng bắn trong 30 ngày, vì điều này có thể mở đường cho việc chấm dứt xung đột với Nga. Tuy nhiên, điều này không có nghĩa là đóng băng xung đột, theo Bộ trưởng Ngoại giao Ukraine Andrii Sybiha.
(ĐTCK) Thứ Tư (12/3), Liên minh châu Âu (EU) đã công bố khoảng 28 tỷ USD thuế quan trả đũa theo kế hoạch đối với hàng xuất khẩu của Mỹ, chỉ sau vài giờ sau khi thuế quan toàn diện của Tổng thống...
Công ty Chứng khoán Rồng Việt (VDSC – Mã: VDS) vừa công bố báo cáo tài chính riêng quý I, ghi nhận kết quả kinh doanh lao dốc cả về doanh thu và lợi nhuận. Đây được xem là quý kinh doanh khó khăn trong...
Sáng 19/4, tại hội thảo "Lựa chọn doanh nghiệp tốt", Chủ tịch FiinGroup Nguyễn Quang Thuân chia sẻ cách xây dựng danh mục đầu tư hiệu quả dựa trên bộ tiêu chí lọc cổ phiếu, giúp nhà đầu tư cá nhân tiệm cận tư duy của tổ chức lớn.
Thời điểm Vingroup khởi công dự án diễn ra trong bối cảnh TP. HCM chuẩn bị hợp nhất hành chính với các tỉnh Bình Dương và Bà Rịa – Vũng Tàu, trở thành siêu đô thị có GRDP ước đạt 114,3 tỷ USD.
TPBank dự kiến chia cổ tức tiền mặt tỷ lệ 10%, đồng thời tăng vốn điều lệ lên hơn 27.740 tỷ đồng thông qua phát hành cổ phiếu để trả cổ tức cho cổ đông hiện hữu.
(ĐTCK) Sau tuần phục hồi, thị trường đã chuyển qua trạng giằng co và điều chỉnh nhẹ. Cùng Đầu tư Chứng khoán nhìn lại nhận định thị trường trong tuần qua.
(ĐTCK) Nhà đầu tư ngoại đã có tuần giao dịch sôi động và bán ròng hơn 5.200 tỷ đồng, gấp hơn 3 lần so với tuần trước, với tâm điểm là một cổ phiếu lớn bị bán ròng tới gần 4.500 tỷ đồng.
Khu đô thị du lịch biển Cần Giờ diện tích 2.870 ha do Tập đoàn Vingroup đầu tư sẽ có tòa tháp cao 108 tầng, safari, công viên chủ đề, khu biệt thự hạng sang, các toà căn hộ cao cấp...
Ông Trần Minh Đạt, người từ Ngân hàng Quân đội (MB), sẽ đảm nhận vị trí Chủ tịch HĐQT của MIC sau khi ông Uông Đông Hưng từ nhiệm.
Cảnh báo rủi ro
Mọi ý kiến, tin tức, nghiên cứu, phân tích, giá cả hoặc thông tin khác có trên trang web này được cung cấp dưới dạng bình luận thị trường chung và không phải lời khuyên đầu tư.
Nội dung trên trang web này có thể thay đổi bất kỳ lúc nào mà không cần thông báo, và được cung cấp với mục đích duy nhất là hỗ trợ các nhà giao dịch đưa ra quyết định đầu tư độc lập.
Liên kết đến các trang web của bên thứ ba được cung cấp để thuận tiện cho bạn. Các trang web như vậy không nằm trong tầm kiểm soát của chúng tôi và có thể không tuân theo cùng các tiêu chuẩn về quyền riêng tư, bảo mật hoặc khả năng truy cập như của chúng tôi.
Bạn nên biết tất cả các rủi ro liên quan đến giao dịch tài chính, chứng khoán hay tiền mã hoá và tìm kiếm lời khuyên từ một cố vấn độc lập nếu bạn có bất kỳ nghi ngờ nào.
Bạn không nên chia sẻ nội dung trên trang web với người không đủ hiểu biết về thị trường tài chính.
Trang web đang được vận hành thử nghiệm nội bộ, không sử dụng vào mục đích thương mại.