Kỳ lạ DeepSeek: startup AI làm rung chuyển Thung lũng Silicon, nhưng nhà sáng lập là người "ngoại đạo", nhân sự cũng toàn người "nội địa"
Công NghệTin tức

Kỳ lạ DeepSeek: startup AI làm rung chuyển Thung lũng Silicon, nhưng nhà sáng lập là người "ngoại đạo", nhân sự cũng toàn người "nội địa"

Nếu có một câu chuyện khởi nghiệp làm thay đổi cách thế giới nhìn về AI, đó phải là hành trình của Liang Wenfeng – nhà sáng lập DeepSeek. Từ một quản lý quỹ đầu cơ ẩn danh, Liang đã xây dựng công ty AI nhỏ bé thành "hiện tượng" toàn cầu, thách thức những gã khổng lồ Mỹ bằng mô hình ngôn ngữ R1 mạnh mẽ và chiến lược "mở cửa" công nghệ.

Liang Wenfeng: Từ phố Wall đến phòng thí nghiệm AI

Liang Wenfeng không phải là cái tên xa lạ trong giới tài chính. Trước khi thành lập DeepSeek, ông gây dựng High-Flyer – một quỹ đầu cơ (hedge fund) ứng dụng AI và thuật toán để dự đoán biến động thị trường. Tại đây, Liang và đội ngũ đã làm chủ công nghệ, sử dụng GPU của Nvidia để chạy mô hình giao dịch tốc độ cao, tích lũy khối tài sản khổng lồ.

1738034747-deepseek-ai-ceo.jpg
Liang Wenfeng, nhà sáng lập của DeepSeek hóa ra lại là một người ngoại đạo với ngành công nghệ

Năm 2021, khi AI toàn cầu bùng nổ, Liang bắt đầu một dự án phụ: mua hàng nghìn GPU NVIDIA để thử nghiệm mô hình ngôn ngữ lớn (LLM). Động thái này ban đầu bị giới đầu tư coi là "kỳ quặc". Một đối tác kinh doanh của Liang chia sẻ: "Khi ấy, ông ấy như một người đam mê công nghệ với kiểu tóc lỗi thời, nói về việc xây cụm 10.000 chip để huấn luyện AI. Chúng tôi nghĩ đó là ảo tưởng!".

Nhưng Liang kiên định với tầm nhìn: "Tôi muốn tạo ra thứ gì đó thay đổi cuộc chơi". Năm 2023, ông rời High-Flyer, dồn toàn lực cho DeepSeek – startup AI với sứ mệnh phát triển trí tuệ nhân tạo đạt trình độ con người.

DeepSeek: Ra đời từ những hạn chế và sự sáng tạo

Khác với OpenAI hay Google DeepMind – những công ty được rót vốn hàng tỷ USD – DeepSeek được nuôi dưỡng bằng chính lợi nhuận từ quỹ đầu cơ của Liang. Ông không gọi vốn bên ngoài, cũng không vội thương mại hóa sản phẩm. Thay vào đó, Liang dùng tiền từ High-Flyer để chiêu mộ nhân tài AI hàng đầu Trung Quốc, trả lương cao ngang ByteDance – công ty sở hữu TikTok.

Bước ngoặt đến khi Mỹ siết chặt xuất khẩu chip AI cao cấp sang Trung Quốc. Trong khi các công ty địa phương loay hoay tìm giải pháp thay thế, đội ngũ DeepSeek – phần lớn là kỹ sư tốt nghiệp Đại học Bắc Kinh, Thanh Hoa – đã có sẵn kinh nghiệm tối ưu GPU từ thời High-Flyer. "Họ hiểu sâu cách vận hành chip, biết cách 'vắt kiệt' sức mạnh từ những GPU đời cũ", một nhà nghiên cứu gần DeepSeek tiết lộ.

1738034751-nvidia.jpg
Thay vì các GPU cao cấp, nền tảng phát triển của DeepSeek phần lớn dựa vào các GPU NVIDIA hiệu suất thấp hơn

Kết quả là vào tháng 1/2024, DeepSeek công bố R1 – mô hình LLM 671 tỷ tham số, được huấn luyện chỉ với 2.048 GPU H800 và 5,6 triệu USD. Con số này chỉ bằng 1/20 chi phí của OpenAI hay Google cho mô hình tương đương. "DeepSeek chứng minh rằng không cần nguồn lực khổng lồ để đuổi kịp đối thủ", Ritwik Gupta, chuyên gia Đại học California, nhận xét.

Hơn thế nữa, Liang Wenfeng xây dựng DeepSeek như một phòng thí nghiệm "thuần Trung Quốc". Khác với nhiều startup công nghệ nước này thường săn đón nhân tài từ Harvard hay MIT, đội ngũ cốt lõi của DeepSeek đều tốt nghiệp từ các đại học trong nước. "Chúng tôi không có thành viên nào từng du học. Phải tự đào tạo nhân tài hàng đầu", Liang tuyên bố trong một cuộc phỏng vấn.

Văn phòng DeepSeek tại Bắc Kinh và Hàng Châu được mô tả là "khuôn viên đại học dành cho nghiên cứu chuyên sâu", nơi các kỹ sư tập trung phát triển công nghệ thay vì chạy theo lợi nhuận. Một đối tác kinh doanh của Liang cho biết: "Họ tin vào tầm nhìn của ông ấy: chứng minh người Trung Quốc có thể sáng tạo từ con số không".

1738034744-deepseek-2.jpg

Thách thức trước cuộc đua công nghệ

Dù gây chấn động, DeepSeek vẫn đối mặt với thử thách lớn. Các đối thủ Mỹ như OpenAI và xAI của Elon Musk đang đổ hàng trăm tỷ USD vào siêu máy tính và chip Blackwell thế hệ mới. Trong khi đó, hiệu suất của High-Flyer – nguồn tài chính chính của DeepSeek – đã giảm sút vào năm 2024 do Liang dành phần lớn thời gian cho AI.

Tuy nhiên, câu chuyện của Liang Wenfeng và DeepSeek đã viết nên một chương mới trong làng công nghệ: Một startup nhỏ, xuất phát từ lĩnh vực tài chính, có thể thách thức những gã khổng lồ nhờ tối ưu hóa tài nguyên, nuôi dưỡng nhân tài nội địa và dám công khai bí quyết công nghệ. Như lời một nhà đầu tư AI ở Bắc Kinh: "DeepSeek giống như DeepMind thời kỳ đầu – họ chỉ tập trung vào nghiên cứu, không bị áp lực thương mại".

Thành công của DeepSeek không chỉ nằm ở công nghệ. Nó phản ánh sự linh hoạt của các startup Trung Quốc trong việc biến hạn chế thành lợi thế, cùng khả năng đào tạo nhân tài "cây nhà lá vườn". Khi Liang Wenfeng – một người "ngoại đạo" trong giới AI – có thể tạo ra đối thủ đáng gờm của ChatGPT, Silicon Valley buộc phải thừa nhận: Trong cuộc đua trí tuệ nhân tạo, không có bức tường nào là vĩnh cửu.

Nguyễn Hải

Bình Luận

Tin liên quan