Tại sự kiện Tech Summit diễn ra tại Mỹ, bên cạnh việc chia sẻ kinh nghiệm, Viettel cũng đã trình bày về những thành công trong việc ứng dụng ngôn ngữ lớn (LLM) tiếng Việt.
Sự kiện Tech Summit 2024 do Viet Spark, Viet Tech Society và Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) đồng tổ chức ngày 16-17/8.
Sự kiện này được tổ chức thường niên tại trung tâm đổi mới sáng tạo của Mỹ. Theo đại diện Viettel, Tech Summit năm nay có sự tham gia của gần 400 chuyên gia, kỹ sư và sinh viên công nghệ tại Mỹ. Bên cạnh đó, còn có sự xuất hiện của các chuyên gia công nghệ đến từ Amazon, Tiktok, Microsoft AI, Google DeepMind.
Sự kiện Tech Summit 2024 diễn ra tại Mỹ. Ảnh: Viettel
Trong khuôn khổ sự kiện, ông Nguyễn Hoàng Hưng, Giám đốc Công nghệ Viettel AI có bài tham luận trình bày quá trình phát triển nghiên cứu phát triển công nghệ mới tại tập đoàn, trong đó có mô hình ngôn ngữ lớn (LLM – Large Language Model).
Đại diện Viettel cho biết, LLM đã trở thành một công cụ quan trọng trong việc phát triển trí tuệ nhân tạo (AI) trên toàn cầu. Từ năm 2023 trở lại đây, LLM đã có những bước phát triển nhảy vọt, với những ứng dụng mang tính đột phá, đặc biệt là trong lĩnh vực xử lý ngôn ngữ tự nhiên. LLM có thể được áp dụng với nhiều mục đích như truy xuất thông tin, phân tích sắc thái, sinh văn bản, sinh đoạn code, tạo chatbot và AI hội thoại...
Về việc phát triển chatbot, LLM mang đến hiệu suất tốt hơn so với các mô hình chatbot truyền thông cả về khả năng hiểu ngôn ngữ tự nhiên, khả năng hội thoại, mức độ thích nghi, hỗ trợ đa ngôn ngữ, hiểu ngữ cảnh, trong khi dữ liệu huấn luyện đầu vào đa dạng hơn, ít phụ thuộc vào các nguyên tắc và kiểu mẫu được đặt sẵn. Tuy nhiên, việc ứng dụng LLM vào ngữ cảnh tiếng Việt lại không phải là một điều dễ dàng.
Ông Nguyễn Hoàng Hưng, Giám đốc Công nghệ Viettel AI. Ảnh: Viettel
"Trong quá trình nghiên cứu và làm chủ công nghệ này, Viettel AI cũng đối mặt với nhiều thách thức. Các mô hình của LLM thường yêu cầu một lượng lớn dữ liệu để đào tạo, trong khi đó, dữ liệu tiếng Việt có nhiều đặc thù riêng, đòi hỏi nhiều nỗ lực xử lý tỉ mỉ, cẩn thận", ông Nguyễn Hoàng Hưng nói.
Vị này cho biết thêm, việc đảm bảo độ chính xác và phù hợp của LLM với ngữ cảnh sử dụng tại Việt Nam là một yếu tố quan trọng, đòi hỏi Viettel AI phải tiến hành nhiều nghiên cứu chuyên sâu và thử nghiệm thực tế. LLM cũng phát sinh một số hạn chế như nhiều thông tin biến tấu, không chính xác, chưa hoàn thiện về kỹ năng lập kế hoạch, phân tích nguyên nhân-kết quả...
Theo đại diện đến từ Viettel, một trong những yếu tố quan trọng trong việc phát triển LLM là chuyên môn hóa mô hình ngôn ngữ để phù hợp với nhu cầu đặc thù của thị trường Việt Nam, bao gồm tối ưu hóa khả năng tương tác với dữ liệu tiếng Việt và giảm thiểu rào cản ngôn ngữ.
"Đến nay, Viettel AI đã thành công trong việc ứng dụng LLM tiếng Việt do đơn vị làm chủ vào các sản phẩm và dịch vụ thực tiễn. Đặc biệt, Viettel đã phát triển Trợ lý ảo hỗ trợ hỏi đáp các vấn đề về pháp luật. Được triển khai tại hệ thống Tòa án trên 100% tỉnh thành tại Việt Nam, Trợ lý ảo Pháp luật Viettel hỗ trợ các thẩm phán tra cứu văn bản, thông tin pháp luật, tự động hóa quy trình làm việc, đưa ra hướng dẫn ứng dụng pháp luật, đoán định tư pháp", ông Nguyễn Hoàng Hưng chia sẻ. "Với khối lượng tri thức pháp luật đồ sộ lên tới hơn 170.000 văn bản pháp luật, 1,4 triệu bản án, 73 án lệ..., Trợ lý ảo Pháp luật giúp giảm 30% khối lượng công việc của Thẩm phán".
Tiếp nối thành công của Trợ lý ảo ứng dụng tại Tòa án, Viettel AI đang hoàn thiện phiên bản Trợ lý ảo phục vụ cán bộ công chức, hỗ trợ tra cứu thông tin từ hơn 100.000 văn bản pháp luật, tự động cập nhật thông tin và kiến thức pháp luật từ các nguồn đáng tin cậy, giúp tăng đáng kể hiệu suất cũng như tính chính xác trong công việc của các tổ chức chính phủ.
Cũng theo ông Hưng, Viettel AI cam kết tiếp tục đầu tư vào nghiên cứu và phát triển, nâng cao chất lượng sản phẩm và dịch vụ, đưa AI trở thành một phần không thể thiếu trong công cuộc kiến tạo tương lai số tại Việt Nam và trong khu vực.
Hội An
Đăng thảo luận