DeepSeek, do tỷ phú Lương Văn Phong (Liang Wenfeng) thành lập, nổi lên như một đối thủ không ngờ trong cuộc đua trí tuệ nhân tạo (AI) toàn cầu. Xuất phát từ một quỹ phòng hộ giao dịch định lượng, công ty nhanh chóng phát triển thành một trong những nhà nghiên cứu AI đáng chú ý nhất của Trung Quốc.
Hệ thống trí tuệ nhân tạo của DeepSeek, có tên gọi R1, được công bố lần đầu vào dịp Giáng Sinh 2024, với năng lực có thể sánh ngang với các chatbot hàng đầu từ các công ty như OpenAI và Google. Không những vậy, trong một bài báo giải thích cách xây dựng hệ thống AI của riêng mình, các kỹ sư từ DeepSeek tiết lộ họ chỉ sử dụng một phần nhỏ các chip máy tính chuyên dụng mà các công ty AI hàng đầu dựa vào, với kinh phí rất phải chăng.
Sự ra mắt phiên bản R1 của DeepSeek châm ngòi cho một cuộc tranh luận sôi nổi tại Thung lũng Silicon về khả năng bảo vệ lợi thế kỹ thuật của các công ty AI giàu tài nguyên của Mỹ, chẳng hạn như Google, Meta hay Anthropic.
Trong khi đó, Lương Văn Phong được xem như một người hùng tại quê nhà. Tuần qua, ông là nhà lãnh đạo duy nhất trong lĩnh vực trí tuệ nhân tạo được mời tham dự một cuộc họp công khai giữa các doanh nhân với Thủ tướng Trung Quốc Lý Cường. Tại cuộc họp, các doanh nhân được chỉ đạo "tập trung mọi nguồn lực để bứt phá các công nghệ cốt lõi trọng yếu".
Quý hồ tinh, bất quý hồ đa
Điều làm cho DeepSeek trở nên đặc biệt là khả năng phát triển các mô hình AI với chi phí cực kỳ thấp. Trong khi các ông lớn công nghệ như OpenAI và Google thường chi hàng trăm triệu USD để phát triển các hệ thống AI, DeepSeek chỉ mất chưa đến 6 triệu USD để tạo ra một mô hình ngôn ngữ lớn với hiệu suất ngang ngửa.
Bản thân công ty từng tuyên bố chỉ sử dụng 2.048 GPU Nvidia H800 và 5,6 triệu USD để huấn luyện một mô hình với 671 tỷ tham số. Đây là một con số khiêm tốn nếu so với số tiền và tài nguyên mà OpenAI và Google đã đầu tư để huấn luyện các mô hình cùng quy mô.
Sau khi Mỹ cấm Nvidia xuất khẩu những dòng chip mạnh nhất sang Trung Quốc, các công ty AI nội địa tại quốc gia tỷ dân buộc phải tìm kiếm những cách thức sáng tạo để tối đa hóa sức mạnh tính toán từ số lượng chip hạn chế trong nước. Đây lại là vấn đề mà Lương Văn Phong và các cộng sự từ lâu đã biết cách giải quyết.
"Các kỹ sư của DeepSeek tỏ ra vô cùng tài tình trong việc khai thác tối đa sức mạnh tính toán của những GPU này, dù không phải thuộc hàng tân tiến nhất," một nhà nghiên cứu AI có mối quan hệ mật thiết với công ty chia sẻ với báo Financial Times.
Không giống nhiều công ty công nghệ khác, DeepSeek tập trung xây dựng đội ngũ hoàn toàn từ nhân tài trong nước. Công ty tuyển dụng các tiến sĩ từ những trường đại học hàng đầu Trung Quốc như Đại học Bắc Kinh, Đại học Thanh Hoa và Đại học Hàng Không Vũ trụ Bắc Kinh, với mức lương cạnh tranh nhất trong ngành.
"Văn phòng của DeepSeek tựa như một khuôn viên đại học dành riêng cho những nhà nghiên cứu nghiêm túc", một đối tác kinh doanh của công ty nhận xét. "Đội ngũ tại đây tin tưởng vào tầm nhìn của Lương: chứng minh cho thế giới thấy rằng người Trung Quốc có thể sáng tạo và xây dựng nên những điều vĩ đại từ con số không".
Đối trọng lớn hay hiện tượng nhất thời?
Giới chuyên môn nhận định, sự tập trung tuyệt đối vào nghiên cứu của DeepSeek khiến họ trở thành đối thủ đáng gờm với thung lũng Silicon. Thay vì tìm cách độc chiếm những đột phá của mình để thu lợi nhuận thương mại, DeepSeek lại sẵn sàng chia sẻ rộng rãi với cộng đồng. Điều đáng chú ý là công ty chưa từng tiếp nhận vốn đầu tư từ bên ngoài và cũng chưa có động thái đáng kể nào nhằm thương mại hóa các mô hình AI của mình.
Dù đạt được những thành tựu ấn tượng, song DeepSeek vẫn phải đối mặt với nhiều thách thức. Giới chuyên môn nhận định việc công ty có khả năng duy trì tính cạnh tranh của mình trong bối cảnh ngành công nghệ AI không ngừng phát triển vẫn còn là một dấu hỏi lớn.
Các doang nghiệp công nghệ tầm cỡ ở Mỹ - đối trọng trực tiếp của Trung Quốc, chắc chắn không hề “khoanh tay đứng nhìn”.Tuần này, dưới sự đàm phán của Tổng thống Mỹ Donald Trump, OpenAI tuyên bố thành lập một liên doanh với tập đoàn SoftBank của Nhật Bản, đặt tên là Stargate, với kế hoạch đầu tư ít nhất 100 tỷ USD vào cơ sở hạ tầng AI tại Mỹ.
Thung lũng Silicon được cho là đang tích cực xây dựng những "cụm" siêu máy tính khổng lồ, tận dụng sức mạnh của chip Blackwell thế hệ mới nhất từ Nvidia. Ngoài ra, công ty xAI của tỷ phú công nghệ Elon Musk đang mở rộng đáng kể siêu máy tính Colossus của mình để chứa hơn 1 triệu GPU, nhằm hỗ trợ đào tạo các mô hình AI Grok của riêng mình.
Điều này hứa hẹn tạo ra một bước nhảy vọt về khả năng tính toán của các mô hình AI tại Mỹ, với tiềm năng nới rộng khoảng cách về hiệu suất so với các đối thủ đến từ Trung Quốc. Đó cũng là giai đoạn chứng minh những "ngựa ô" công nghệ như DeepSeek có thật sự là đối thủ xứng tầm hay chỉ là "kẻ ngáng đường" nhất thời.
"DeepSeek sở hữu một trong những cụm máy tính tiên tiến lớn nhất tại Trung Quốc", một đối tác kinh doanh của tỷ phú Lương Văn Phong cho biết. "Hiện tại, họ vẫn có đủ công suất, nhưng chưa chắc có thể duy trì chúng được lâu dài".