MMAI Global
Posts
Bản Tin AI Labs: Tổng Hợp Tin Tức Mới Nhất về Trí tuệ Nhân tạo

Bản Tin AI Labs: Tổng Hợp Tin Tức Mới Nhất về Trí tuệ Nhân tạo

🗣️ Ra mắt giọng nói nâng cao của GPT-4o, Tiết lộ dữ liệu huấn luyện bị đánh cắp của các công ty lớn, Đối thủ mới của Sora và nhiều hơn nữa.

July 25, 2024 • Thời gian đọc: 19 minutes

Chào mừng bạn đến với bản tin nóng hổi nhất từ AI Labs! Tuần qua, làng AI đã chứng kiến những biến động đáng kinh ngạc. Từ những công nghệ AI đỉnh cao đến những vấn đề đạo đức nan giải, tất cả đều được tổng hợp ngay tại đây. Cập nhật ngay để không bỏ lỡ bất kỳ xu hướng nào nhé!

Tóm tắt nội dung của số lần này:

🗣️ Ra mắt giọng nói nâng cao của GPT-4o trong tháng này
⚡️ OpenAI giới thiệu GPT-4o Mini
🚫 AI được huấn luyện trên YouTube mà không có sự đồng ý
🖼️ Mang hình ảnh của bạn trở nên sống động với Motion
👀 OpenAI huấn luyện AI để giải thích bản thân tốt hơn
🤯 Đối thủ mới của Sora: Haiper 1.5
📲 Ứng dụng thiết kế AI của Microsoft ra mắt trên di động
🤖 Câu chuyện AI

Các cập nhật chính về AI

🗣 Ra mắt giọng nói nâng cao của GPT-4o trong tháng này

OpenAI sẽ ra mắt giọng nói nâng cao cho GPT-4o vào cuối tháng này, hứa hẹn mang lại trải nghiệm người dùng tốt hơn. Giọng nói mới này được thiết kế để tự nhiên và dễ nghe hơn, giúp các tương tác với AI trở nên mượt mà và hiệu quả hơn.

Những cải tiến mới

Giọng nói tự nhiên hơn: Giúp người dùng cảm thấy như đang trò chuyện với con người.
Khả năng nhận dạng giọng nói chính xác hơn: Cải thiện độ chính xác trong việc hiểu và phản hồi.
Ứng dụng đa lĩnh vực: Hữu ích trong dịch vụ khách hàng, giáo dục, và nhiều lĩnh vực khác.

CEO của OpenAI, Sam Altman, cho biết những người dùng đầu tiên sẽ bắt đầu được truy cập vào giọng nói nâng cao của GPT-4o trong vài tuần tới, nhưng đây sẽ là một đợt triển khai "alpha" hạn chế.

Tính Năng Chính
GPT-4o giọng nói nâng cao là một loại trợ lý giọng nói hoàn toàn mới có thể tạo ra giọng nói nhân vật tùy chỉnh, tạo hiệu ứng âm thanh khi kể chuyện và thậm chí hoạt động như một người phiên dịch trực tiếp.

Các Biện Pháp An Toàn
OpenAI lo ngại rằng GPT-4o giọng nói nâng cao mà không có các biện pháp bảo vệ phù hợp có thể cung cấp thông tin có hại hoặc được sử dụng một cách không mong muốn. Để giải quyết vấn đề này, họ sẽ ra mắt Alpha với một nhóm người dùng nhỏ để thu thập phản hồi và mở rộng dựa trên những gì họ học được.

Cập Nhật Tương Lai
Các cập nhật tương lai sẽ bổ sung các tính năng nhìn trực tiếp, cho phép AI nhìn thấy những gì bạn thấy, tăng cường khả năng tương tác của nó và làm cho nó trở thành một trợ lý đa năng hơn nữa.

⚡️ OpenAI cho ra mắt GPT-4o Mini

Khả Năng Truy Cập AI: Mô Hình Đa Chiều Giá Rẻ
OpenAI vừa ra mắt GPT-4o Mini, một biến thể nhỏ gọn và tiết kiệm ngân sách của mô hình GPT-4o mạnh mẽ của họ.

Hiệu Suất Và Chi Phí
GPT-4o Mini là một mô hình đa chiều hoàn toàn, hiện tại có khả năng tạo văn bản và hình ảnh. Nó đạt điểm 82% trên chuẩn MMLU, vượt qua GPT-3.5 Turbo (70%) và thách thức Claude 3 Haiku (75,2%) và Gemini 1.5 Flash (78,9%). Điều đáng kể là nó rẻ hơn đến 60% so với GPT-3.5 Turbo, làm cho nó trở thành một sự thay đổi lớn cho các nhà phát triển với ngân sách hạn hẹp.

Khả Năng
Nó vượt trội hơn GPT-3.5 và không kém gì GPT-4 trong nhiều nhiệm vụ, xử lý 128000 token một cách dễ dàng cho các tương tác phức tạp và xử lý dữ liệu mở rộng. Mô hình này mở ra những khả năng mới cho các nhà phát triển đang tìm kiếm hiệu suất cao với chi phí phải chăng.

🚫 AI Được Huấn Luyện Trên YouTube Mà Không Có Sự Đồng Ý

Các Vấn Đề Đạo Đức: Sử Dụng Dữ Liệu Không Được Phép
Một cuộc điều tra mới của Proof News đã tiết lộ rằng các công ty công nghệ lớn bao gồm Apple, Anthropic, Nvidia và Salesforce đã sử dụng nội dung từ hơn 170000 video trên YouTube để huấn luyện các mô hình AI của họ mà không có sự đồng ý của người sáng tạo.

Chi Tiết Về Tập Dữ Liệu
Tập dữ liệu được gọi là "YouTube Subtitles" chứa bản dịch từ hơn 48000 kênh bao gồm các người sáng tạo nổi tiếng, các kênh tin tức và học tập. EleutherAI, một tổ chức phi lợi nhuận, đã biên soạn dữ liệu này như một phần của bộ sưu tập lớn hơn gọi là 'The Pile' nhằm cung cấp tài liệu huấn luyện cho các nhà phát triển và học giả.

Người Sáng Tạo Không Biết
Các người sáng tạo không biết rằng nội dung của họ đã được sử dụng cho mục đích huấn luyện AI và Điều khoản Dịch vụ của YouTube cũng cấm sử dụng mà không có sự cho phép. Apple được cho là đã sử dụng tập dữ liệu để huấn luyện OpenELM, một mô hình liên quan đến các tính năng AI mới cho iPhone và MacBook.

Hệ Quả
Mặc dù việc sử dụng các bản dịch này có thể không dẫn đến các hệ quả pháp lý cho các công ty liên quan, nhưng nó chắc chắn gây ra các vấn đề đạo đức và luân lý. Báo cáo này nêu bật các vấn đề liên quan đến việc sử dụng dữ liệu không được phép trong huấn luyện AI và tác động tiềm tàng của nó đối với các người sáng tạo và cộng đồng AI rộng lớn hơn.

Những phát triển mới

🖼️ Mang Hình Ảnh Của Bạn Trở Nên Sống Động Với Motion

Công Cụ Sáng Tạo: Tính Năng Motion Của Leonardo AI
Leonardo AI đã giới thiệu một tính năng mới gọi là "Motion" cho phép người dùng biến các hình ảnh tĩnh thành các đoạn hoạt hình ngắn đầy hấp dẫn. Tính năng này được thiết kế cho truyền thông xã hội, thiết kế web, nghệ sĩ kỹ thuật số và nhiều hơn nữa.

Cách Sử Dụng Motion
Đăng ký trên trang web của Leonardo AI (tài khoản miễn phí bao gồm 150 tín dụng mỗi ngày). Từ bảng điều khiển chính, nhấp vào "Image Generation" trong menu bên. Tạo một hình ảnh bằng cách sử dụng lời nhắc của bạn. Chọn hình ảnh yêu thích của bạn, di chuột qua nó và nhấp vào nút ‘Motion’. Điều chỉnh thanh trượt Motion Strength theo ý muốn. Nhấp vào "Generate" và kiểm tra sáng tạo động của bạn! Tính năng mới này cung cấp một cách thú vị để người dùng nâng cao hình ảnh tĩnh của họ với các yếu tố động, làm cho nội dung của họ hấp dẫn hơn.

👀 OpenAI Huấn Luyện AI Để Giải Thích Bản Thân Tốt Hơn

Đột Phá Nghiên Cứu: Các Đầu Ra AI Có Thể Xác Minh
OpenAI đã công bố nghiên cứu mới chi tiết một phương pháp làm cho các mô hình ngôn ngữ lớn tạo ra các đầu ra dễ hiểu và có thể xác minh hơn. Kỹ thuật này liên quan đến một trò chơi giữa hai AI để làm cho các thế hệ dễ 'đọc' hơn đối với con người.

Trò Chơi Prover-Verifier
Phương pháp sử dụng một "Trò Chơi Prover-Verifier" nơi một mô hình AI mạnh hơn (người chứng minh) cố gắng thuyết phục một mô hình yếu hơn (người xác minh) rằng câu trả lời của nó là đúng. Qua nhiều vòng chơi, người chứng minh học cách tạo ra các giải pháp không chỉ đúng mà còn dễ dàng kiểm tra hơn.

Kết Quả Và Ứng Dụng
Mặc dù phương pháp này tăng độ chính xác lên khoảng 50% so với tối ưu hóa chỉ vì đúng, các giải pháp của nó dễ dàng kiểm tra bởi con người.

Ý Nghĩa
Nghiên cứu này cung cấp một cách mở rộng để tiềm năng giữ các hệ thống 'trung thực', mặc dù sự đánh đổi hiệu suất nêu bật thách thức của việc cân bằng khả năng với tính giải thích.

😉Thích thú với nội dung này? Hãy chia sẻ nó với bạn bè của bạn!

AI Labs Newsletter

🤯 Đối Thủ Mới Của Sora: Haiper 1.5

Tạo Video Chất Lượng Cao
Một đối thủ khác trong không gian tạo video, Sora AI vừa ra mắt Haiper 1.5, một công cụ có thể tạo ra đến 8 giây video chất lượng cao và bao gồm một công cụ nâng cao độ phân giải cho các thế hệ HD.

Trải Nghiệm Người Dùng

Người dùng có thể thử công cụ này miễn phí tại haiper(dot)ai. Dưới đây là một ví dụ lời nhắc để kiểm tra công cụ: "POV của một người đàn ông trên một chuyến tàu đang di chuyển với những phản chiếu của dãy Alps Thụy Sĩ trên cửa sổ tàu." Công cụ này cung cấp các khả năng mới để tạo ra nội dung video hấp dẫn một cách dễ dàng.

📲 Ứng Dụng Thiết Kế AI Của Microsoft Ra Mắt Trên Di Động

Đổi Mới Công Nghệ: Thiết Kế Dựa Trên AI
Microsoft đã công bố rằng ứng dụng thiết kế dựa trên AI của họ hiện có sẵn trên toàn thế giới, mang lại các khả năng tạo hình ảnh, chỉnh sửa và thiết kế tiên tiến cho người dùng trên các nền tảng di động và Windows. Đây là một bước tiến quan trọng trong việc làm cho các công cụ thiết kế AI trở nên tiếp cận rộng rãi hơn.

Tính Năng Chính
Designer có sẵn trên hơn 80 ngôn ngữ trên web, Android và iOS, và thông qua các nền tảng Windows. Ứng dụng sử dụng AI để tạo ra hình ảnh và thiết kế từ các lời nhắc văn bản, cho phép người dùng tạo các nhãn dán, biểu tượng cảm xúc, avatar tùy chỉnh và nhiều hơn nữa.

Khả Năng Mới
Các tính năng mới bao gồm 'prompt templates' để tạo nhanh, 'Restyle' để làm lại các hình ảnh hiện có và 'Frame' để tạo ra các khung và bức tranh cá nhân hóa. Nỗ lực của Microsoft trong không gian thiết kế AI diễn ra giữa sự cạnh tranh từ các đối thủ lớn như Canva và Adobe, đánh dấu một sự biến đổi trong cách mọi người tiếp cận thiết kế.

Câu chuyện về AI

🤖Câu Chuyện AI

🦾 Anthropic đang làm việc trên một công cụ chụp màn hình mới cho Claude, có khả năng cho phép người dùng chụp màn hình một cách liền mạch từ các màn hình hoặc tab khác.

📜 Các nhà lập pháp bang California đang thúc đẩy một dự luật yêu cầu các công ty công nghệ lớn kiểm tra AI về các rủi ro "thảm khốc" trước khi ra mắt công khai.

💻 AMD tuyên bố các chip máy tính xách tay mới của họ có thể vượt trội hơn Apple M3 - với hiệu suất cải thiện trong đa nhiệm, xử lý hình ảnh và chơi game.

🖼️ Google được cho là đang phát triển 'Prompts Gallery' cho phép người dùng sưu tập một bộ sưu tập các lời nhắc yêu thích và lấy cảm hứng từ các người dùng khác trong các chatbot Gemini của họ.

🗣️ Perplexity đã triển khai Chế Độ Giọng Nói cho trợ lý AI của mình trên ứng dụng iOS, cho phép người dùng Pro trò chuyện và đặt câu hỏi cho công cụ tìm kiếm AI thông qua chế độ giọng nói.

Nguồn Cảm Hứng Nghệ Thuật AI

Một bức ảnh tài liệu về một người phụ nữ sợ hãi với mái tóc đen bơi trong đại dương, xung quanh là rất nhiều rác thải nhựa nổi trên mặt nước. Cô ấy nhìn về phía trước, hướng về máy ảnh. Cảnh diễn ra trên nền biển xanh với các hòn đảo xanh tươi nhìn từ xa. Tâm trạng tổng thể nên là buồn bã và ấn tượng, vừa thể hiện sự cô lập của cô ấy khỏi đời sống biển vừa cảnh báo về sự bất cẩn dẫn đến ô nhiễm môi trường. --ar 2:1

Cảm ơn bạn đã đọc! Nếu bạn thấy hữu ích hoặc thú vị,, hãy lan tỏa bản tin này đến một người bạn hoặc đồng nghiệp của mình nhé!

Hẹn các bạn ở bản tin kế tiếp!

Reply

or to participate.