Vừa mới thấy tin tức thú vị về sự phát triển AI trong lĩnh vực thể hiện nhân vật được giới thiệu bởi Anuttacon, một công ty AI được thành lập bởi Tsai Haoyu, người sáng lập của miHoYo.



Họ vừa ra mắt LPM 1.0, một mô hình thể hiện video nhân vật khá độc đáo. Hệ thống này cho phép nhân vật có thể nói chuyện, hát, nghe và phản ứng đồng thời trong thời gian thực. Hơn nữa, chuyển động của miệng và biểu cảm khuôn mặt, cũng như nhịp điệu của cơ thể trông rất chân thực, không giống như giả lập.

Từ góc độ kỹ thuật, họ sử dụng mô hình cơ bản 17 tỷ tham số và đã tối ưu hóa thành phiên bản phát trực tiếp với độ trễ thấp. Điều đáng chú ý là nó hỗ trợ nhiều phong cách nhân vật khác nhau, từ phong cách thực tế, hoạt hình 2D đến game 3D và thậm chí cả sinh vật không phải con người, mà không cần tùy chỉnh thêm.

Điều tôi nhận thấy là Anuttacon đã ra mắt tiêu chuẩn đánh giá LPM-Bench, giúp đạt kết quả tốt nhất trong nhiều chỉ số so với các mô hình khác trên thị trường. Sự khác biệt chính là LPM 1.0 có thể xuất nội dung không giới hạn thời gian, khác với các lựa chọn khác chỉ giới hạn 30 giây.

Các ứng dụng mà họ quan tâm khá rõ ràng: nhân vật NPC trong game và phát trực tiếp ảo là các trường hợp tiềm năng rất lớn, đặc biệt dành cho miHoYo và các công ty game khác.

Tuy nhiên, cần lưu ý rằng Anuttacon rõ ràng cho biết đây chỉ là ra mắt để trao đổi học thuật. Hiện tại chưa có kế hoạch mở mã nguồn hoặc cung cấp API cho công chúng. Phần lớn cộng đồng tin rằng mục đích chính là thu hút nhân sự AI có năng lực.

Nhìn lại, LPM 1.0 là bước tiếp theo trong hành trình AI của Anuttacon về engine game và NPC thông minh. Ngoài ra, đây còn là một kết quả khác từ quá trình phát triển AI của miHoYo, từ công cụ chat AnuNeko đến khả năng của mô hình cơ bản. Có vẻ như Tsai Haoyu và đội ngũ của ông đang xây dựng điều gì đó mang ý nghĩa quan trọng trong lĩnh vực AI nhân vật.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim