Nội dung chính
Rạng sáng 14/5 (giờ Việt Nam), OpenAI đã công bố mô hình AI mới nhất có tên GPT-4o, với khả năng tương tác giọng nói tự nhiên và xử lý văn bản cũng như hình ảnh. Đây là một bước tiến mới của OpenAI, công ty sáng lập nên ChatGPT và mô hình chuyển đổi văn bản thành video Sora, nhằm tiếp tục khẳng định vị thế dẫn đầu trong lĩnh vực AI.
Trong một sự kiện phát trực tiếp, các nhà nghiên cứu tại OpenAI đã giới thiệu tính năng âm thanh mới, cho phép người dùng giao tiếp với ChatGPT một cách trực tiếp và nhận phản hồi ngay lập tức mà không có độ trễ, cùng với khả năng ngắt lời khi ChatGPT đang phát biểu, tương tự như trong các cuộc đối thoại thực tế mà các trợ lý AI thông thường khó có thể thực hiện.
"Trải nghiệm như đang nói chuyện với AI trong phim... Giao tiếp với máy tính giờ đây đã trở nên tự nhiên hơn bao giờ hết," Sam Altman, Giám đốc điều hành của OpenAI, chia sẻ trong một bài đăng trên blog.
Dù có sự hỗ trợ từ Microsoft, OpenAI vẫn phải đối mặt với sự cạnh tranh khốc liệt và áp lực để mở rộng cơ sở người dùng của ChatGPT, một chatbot AI đã từng khiến thế giới ngỡ ngàng với khả năng tạo ra nội dung văn bản và viết mã phần mềm.
Tại sự kiện, các nhà nghiên cứu OpenAI cũng đã trình diễn khả năng của trợ lý giọng nói mới ChatGPT. Trong một thử nghiệm, ChatGPT đã sử dụng kỹ năng thị giác và giọng nói để giải thích cho một nhà nghiên cứu cách giải một phương trình toán học trên tờ giấy.
Trong một thử nghiệm khác, các nhà nghiên cứu của OpenAI đã trình diễn khả năng dịch ngôn ngữ theo thời gian thực của GPT-4o. Mô hình AI này có thể dịch văn bản từ hình ảnh sang ngôn ngữ mà người dùng yêu cầu, chẳng hạn như tiếng Việt.
Các màn trình diễn của OpenAI khiến không khí như trong một bộ phim khoa học viễn tưởng, nơi ChatGPT và người đối thoại có những cuộc trò chuyện đùa giỡn lẫn nhau. Trong một tình huống, nhà nghiên cứu của OpenAI đã bày tỏ niềm vui khi chứng minh được "Bạn hữu ích và tuyệt vời như thế nào."
ChatGPT đã phản ứng lại một cách dí dỏm: "Ồ, dừng lại đi! Anh đang làm tôi đỏ mặt đấy!"
Mô hình AI như GPT-4o, với khả năng trò chuyện bằng giọng nói thực tế và tương tác qua văn bản lẫn hình ảnh, có thể mang lại nhiều ứng dụng đột phá trong ngành hướng dẫn viên du lịch. Dưới đây là một số cách thức AI này có thể được sử dụng:
Công nghệ AI này được dự báo sẽ không chỉ làm tăng hiệu quả của ngành du lịch mà còn mang lại trải nghiệm tuyệt vời và cá nhân hóa cho du khách, đồng thời giảm gánh nặng cho các hướng dẫn viên con người và cơ sở du lịch trong việc quản lý và cung cấp dịch vụ.