Giọng nói mới của Nvidia A.I. như người thật
- "Thung lũng kỳ lạ" thường được sử dụng để mô tả trí thông minh nhân tạo (A.I.) bắt chước hành vi của con người. Nhưng giọng nói mới của Nvidia A.I. thực tế hơn nhiều so với bất cứ điều gì chúng ta từng nghe trước đây. Sử dụng kết hợp A.I. và một bản ghi âm tham chiếu của con người, giọng giả nghe gần giống với giọng thật.
NVIDIA Chia sẻ Nghiên cứu Tổng hợp Giọng nói Diễn đạt tại Interspeech
- Trong một video (ở trên), nhóm sáng tạo nội bộ của Nvidia mô tả quá trình đạt được khả năng tổng hợp giọng nói chính xác. Nhóm nghiên cứu coi lời nói với âm nhạc, có nhịp điệu, cao độ và nhịp điệu phức tạp và có sắc thái không dễ sao chép. Nvidia đang tạo ra các công cụ để tái tạo những phức tạp này với A.I.
- Công ty đã công bố những tiến bộ mới nhất của mình tại Interspeech, một hội nghị kỹ thuật dành riêng cho việc nghiên cứu các công nghệ xử lý giọng nói. Các công cụ thoại của Nvidia có sẵn thông qua bộ công cụ NeMo mã nguồn mở và chúng được tối ưu hóa để chạy trên GPU Nvidia (tất nhiên là theo Nvidia).
- A.I. giọng nói không chỉ là một bản demo. Nvidia đã chuyển đổi sang A.I. người kể chuyện cho tôi là A.I. loạt video, cho thấy tác động của học máy trong các ngành khác nhau. Giờ đây, Nvidia có thể lồng tiếng nhân tạo với tư cách là người kể chuyện, không có các hiện vật âm thanh thông thường đi kèm với giọng nói tổng hợp.
- Nvidia xử lý A.I. giọng nói theo một trong hai cách. Đầu tiên là đào tạo mô hình chuyển văn bản thành giọng nói trên một bài phát biểu của con người. Sau khi đào tạo đủ, người mẫu có thể nhận bất kỳ đầu vào văn bản nào và chuyển nó thành giọng nói. Phương pháp khác là chuyển đổi giọng nói. Trong trường hợp này, chương trình sử dụng tệp âm thanh của giọng nói của con người và chuyển đổi giọng nói thành A.I. một, phù hợp với mẫu và ngữ điệu.
- Đối với các ứng dụng thực tế, Nvidia chỉ ra vô số trợ lý ảo điều hành các đường dây dịch vụ khách hàng, cũng như các trợ lý có mặt trong các thiết bị thông minh như Alexa và Google Assistant. Tuy nhiên, Nvidia cho biết công nghệ này còn vươn xa hơn nữa. “Chuyển văn bản thành giọng nói có thể được sử dụng trong trò chơi, để hỗ trợ những người bị khiếm khuyết về giọng nói hoặc giúp người dùng dịch giữa các ngôn ngữ bằng giọng nói của họ”, bài đăng trên blog của Nvidia viết.
- Nvidia đang phát triển một sở trường để lừa mọi người bằng cách sử dụng A.I. Công ty gần đây đã đi vào chi tiết về cách họ tạo ra một Giám đốc điều hành ảo cho Hội nghị Công nghệ GPU của mình, được hỗ trợ một phần bởi phần mềm Omniverse của riêng mình.
Viết bình luận
Bình luận
Hiện tại bài viết này chưa có bình luận.