• MMAI Global
  • Posts
  • Giao tiếp một cách tự nhiên với AI?

Giao tiếp một cách tự nhiên với AI?

Liệu giọng đọc của Gemini có đánh bại OpenAI?

Chào mừng quay trở lại các AI Warriors!

Chúng ta đã quen với việc gõ các câu lệnh, nhưng sớm thôi, giao tiếp với AI có thể sẽ giống như trò chuyện với một người bạn. Trong bản tin hôm nay, chúng ta sẽ khám phá lý do tại sao thực tế đó có thể đến sớm hơn bạn nghĩ.

Những Thông Tin Nổi Bật Hôm Nay:

  • xAI ra mắt Grok-2: Tìm hiểu về mô hình mới nhất từ xAI.

  • Tính năng tìm kiếm mở rộng của Google

  • Ấn tượng ban đầu về Gemini Live: Điều gì khiến công cụ này khác biệt?

  • Vài tin thú vị khác trong ngày

  • 5 công cụ AI mới để tăng cường năng suất của bạn.

  • Hình ảnh do AI tạo ra: Vincent Van Dogh.

xAI Ra Mắt Mô Hình Grok-2 Mới Trên X

Nguồn: CoinGape

Trong khi hầu hết các mô hình AI giống như một đồng nghiệp luôn tỏ ra thân thiện, thì mô hình mới nhất của xAI lại có vẻ giống “người bạn thân (nói chuyện rất thoải mái)” của bạn hơn. Phiên bản beta của Grok-2 hiện đã có sẵn cho những người đăng ký X Premium — và cho dù tốt hay xấu, những người dùng đầu tiên đang có nhiều phản hồi khác nhau.

Khả Năng Của Grok-2:

  • Elon Musk và nhóm phát triển của xAI mô tả Grok-2 là một mô hình tiên phong "trực quan hơn, dễ điều khiển và linh hoạt hơn."

  • Nó hiện đứng thứ ba trên Lmsys Chatbot Arena, chỉ sau Gemini 1.5-Pro và phiên bản mới nhất của ChatGPT-4o.

  • Grok-2 có khả năng tích hợp thông tin theo thời gian thực từ X và được trang bị các khả năng thị giác mới.

  • Phiên bản cơ bản, cùng với Grok-2 mini sẽ được phát hành cho các nhà phát triển vào cuối tháng này.

Điều Gây Hứng Thú Cho Người Dùng:

Mô hình tạo hình ảnh mới, được hỗ trợ bởi Flux của Black Forest Labs, nổi tiếng với độ chân thực và độ trung thực cao. Tuy nhiên, các thử nghiệm ban đầu cho thấy phiên bản của xAI thiếu các biện pháp bảo vệ thường có trên các công cụ chuyển đổi văn bản thành hình ảnh khác, dẫn đến sự xuất hiện của các hình ảnh kỳ quặc, thậm chí có thể là hình ảnh gây tranh cãi.

Bối Cảnh Chung: Hiện vẫn chưa rõ liệu xAI có tiếp tục làm Grok-2 trở thành mã nguồn mở như đã làm với Grok-1 hay không. Nếu điều này xảy ra, Grok-2 có thể trở thành mô hình LLM mạnh mẽ nhất được cung cấp hoàn toàn cho các nhà phát triển. Trong thời gian chờ đợi, xAI đang xây dựng thứ có thể trở thành siêu máy tính lớn nhất thế giới tại Memphis, dự kiến sẽ hoạt động đầy đủ vào năm 2025.

Google Mở Rộng Tính Năng Trả Lời Bằng AI Trong Tìm Kiếm Đến Nhiều Quốc Gia Mới

Nguồn: reuters

Google, công ty mẹ Alphabet, vừa công bố mở rộng khả năng tóm tắt trả lời bằng trí tuệ nhân tạo (AI) trong tìm kiếm của mình đến sáu quốc gia mới. Sự mở rộng này diễn ra chỉ sau hai tháng kể từ khi tính năng này được giới thiệu lần đầu tiên, thể hiện nỗ lực không ngừng của Google trong việc cải thiện trải nghiệm người dùng và cung cấp thông tin nhanh chóng, chính xác hơn. Các thị trường mới được bổ sung sẽ mang lại cơ hội cho người dùng tại các quốc gia này tiếp cận thông tin nhanh hơn thông qua AI.

🔍 Các diễn biến chính

Bên cạnh việc mở rộng sang sáu quốc gia mới, Google cũng nhấn mạnh rằng tính năng AI-Generated Summaries sẽ giúp người dùng nhận được các thông tin cô đọng và có liên quan hơn từ tìm kiếm. Người dùng sẽ được cung cấp những bài tóm tắt ngắn gọn, thay vì phải lướt qua nhiều liên kết. Sự cải tiến này không chỉ giúp tiết kiệm thời gian cho người dùng mà còn làm phong phú thêm chất lượng thông tin có sẵn.

💡 Tác động

Việc áp dụng công nghệ AI vào tìm kiếm đánh dấu một bước tiến lớn trong cách mà người tiêu dùng tương tác với thông tin trực tuyến. Mở rộng này hứa hẹn sẽ có tác động tích cực đến cách mà người dùng tìm kiếm và tiêu thụ thông tin trên internet. Điều này không chỉ nâng cao hiệu quả tìm kiếm mà còn đặt ra một tiêu chuẩn mới cho các nền tảng tìm kiếm khác trong việc ứng dụng AI để tối ưu hóa trải nghiệm người dùng. Sự phổ biến của các tính năng này có thể thúc đẩy các công ty công nghệ khác phát triển những giải pháp tương tự.

Gemini Live có thể cạnh tranh với Chế Độ Giọng Nói của OpenAI không?

Nguồn: PCMag

“Người ra mắt đầu tiên không phải lúc nào cũng là người chiến thắng.” Đó là lập luận mà gã khổng lồ tìm kiếm hàng đầu thế giới đưa ra với Gemini Live, một voicebot mới cạnh tranh với chế độ giọng nói của OpenAI. OpenAI đã giới thiệu tính năng giọng nói đáng kinh ngạc của mình vào tháng 5, nhưng chính Gemini Live mới là người sẽ được phát hành rộng rãi đầu tiên.

Các mốc thời gian chồng chéo: Các thuê bao OpenAI Plus đang bắt đầu cảm thấy nôn nóng. Trong khi một số người đã có quyền truy cập vào Chế Độ Giọng Nói vào cuối tháng 7, thì những người khác vẫn đang chờ đợi. Trong khi đó, phiên bản tương đương của Alphabet đã bắt đầu được triển khai cho người dùng Gemini Advanced với điện thoại Android — chức năng trên iOS sẽ xuất hiện trong vài tuần tới.

Nhưng nó hoạt động ra sao?

Hầu hết những người dùng đầu tiên đều ấn tượng, với một cây bút của Wall Street Journal thừa nhận rằng cô ấy "gần như quên mất đó là một bot".

Có sự đồng thuận rằng Gemini Live là một người đối thoại có kỹ năng, có thể tham gia vào mọi loại cuộc thảo luận mở, bao gồm cả việc động não và chuẩn bị phỏng vấn.

Mặc dù nó chưa có khả năng tương tác với thế giới thực — chẳng hạn như đặt báo thức thay bạn — nhưng nó được cho là phát ra âm thanh giống con người nhờ độ trễ tối thiểu và khả năng bị ngắt lời mỗi khi nó đi lệch hướng mà bạn không quan tâm.

Bất ngờ: Các voicebot mới nhất dường như thuyết phục đến mức một số người không thể không coi chúng như những người bạn đồng hành. Về phần mình, OpenAI cho biết trong báo cáo an toàn mới nhất rằng dường như một số người đã bắt đầu hình thành mối liên kết tình cảm với voicebot của họ, giống như trong bộ phim Her năm 2013. Với việc ngày càng nhiều trợ lý giọng nói tràn ngập thị trường, chúng ta đang bước vào một lãnh thổ chưa được khám phá có thể thay đổi cơ bản các động lực xã hội của chúng ta.

5 Công cụ AI Tăng Cường Năng Suất Của Bạn

 Venturekit: Tạo một kế hoạch kinh doanh chiến thắng bao gồm nghiên cứu thị trường, các nhiệm vụ vận hành và dự báo tài chính. Tham khảo Venturekit

 Minimap: Công cụ bản đồ sử dụng AI để sắp xếp không gian các chủ đề tin tức, giúp bạn dễ dàng nhận diện các xu hướng và phạm vi bao phủ ngay lập tức. Tham khảo Minimap

 Spinach AI*: Dự án Quản lý AI đầu tiên trên thế giới. Tham gia các cuộc họp Zoom, Meet, Teams của bạn và ghi lại các nhiệm vụ vào Jira, Asana, Monday, Trello, ClickUp, và Linear. Dùng thử tại đây

 Vola Mail: Viết các mẫu email với sự trợ giúp của AI và gửi chúng chỉ với một lần gọi API. Tham khảo Vola Mail

 Tusk: Tiết kiệm thời gian và công sức bằng cách giao các công việc nhỏ cho một tác nhân AI. Tham khảo Tusk

😉Thích thú với nội dung này? Hãy chia sẻ nó với bạn bè của bạn!

Vài tin thú vị khác trong ngày

Nguồn: Getty Images

Bộ nhớ dài hạn: Claude hiện cho phép các nhà phát triển lưu trữ cache các lời nhắc của họ, giúp họ có thể viết một lời nhắc phức tạp và dễ dàng tham chiếu lại trong tương lai, giảm chi phí lên đến 90%.

Đèn xanh: Một thẩm phán đã ra phán quyết cho phép một nhóm nghệ sĩ tiếp tục vụ kiện bản quyền chống lại các công cụ tạo hình ảnh từ văn bản như Stable Diffusion và Midjourney.

AI Guardian: Sahara AI, một startup do giáo sư tại Đại học Nam California (USC) đồng sáng lập, đã huy động được 43 triệu USD để giúp các công ty như Microsoft và Amazon giải quyết các vấn đề an toàn khi đào tạo các mô hình AI của họ.

War Chest: Radical Ventures đã huy động được gần 800 triệu USD cho một quỹ đầu tư vào các startup AI mới.

😁 Một điều thú vị:

Trong các cuộc đua NASCAR, mili giây có thể tạo ra sự khác biệt lớn. Giờ đây, Lenovo đang giúp Richard Childress Racing sử dụng AI để làm cho các trạm dừng tiếp nhiên liệu trở nên hiệu quả hơn. Mô hình AI đã được tinh chỉnh để biết chính xác lượng nhiên liệu mà xe dự kiến sẽ tiêu thụ, giúp đội ngũ kỹ thuật tính toán thời gian dừng tiếp nhiên liệu chính xác hơn.

🧠 Bổ não:

Các nhà nghiên cứu tại MIT đã biên soạn một kho lưu trữ rủi ro AI có thể nói là toàn diện nhất thế giới. Với hơn 700 rủi ro được liệt kê, các công ty AI có thể tham khảo cơ sở dữ liệu này khi xây dựng các tính năng an toàn cho các mô hình của mình.

Prompt trong ngày

Ngủ Ngon Hơn

Prompt: Liệt kê các rối loạn giấc ngủ phổ biến có thể ảnh hưởng đến chất lượng giấc ngủ của bạn, chẳng hạn như mất ngủ, ngưng thở khi ngủ, hội chứng chân không yên và chứng ngủ rũ, cùng với các triệu chứng và phương pháp điều trị tiềm năng.

Soạn một thói quen ngủ được cá nhân hóa phù hợp với nhu cầu và lịch trình cụ thể của bạn, xem xét các yếu tố như giờ đi ngủ, thời gian thức dậy và thời lượng ngủ lý tưởng của bạn.



Eng: List the common sleep disorders that may affect your quality of sleep, such as insomnia, sleep apnea, restless leg syndrome, and narcolepsy, along with their symptoms and potential treatments.

Compose a personalized sleep routine tailored to your specific needs and schedule, considering factors such as your ideal bedtime, wake-up time, and duration of sleep.

Nguồn: Scaz

Nguồn Cảm Hứng Nghệ Thuật AI

Ban nhạc những chú chó

Lấy cảm hứng từ @tuanbk20790 trên Midjourney

Midjourney prompt: A cartoon [insert dog breed here] playing the drums, with swirling stars and vibrant colors in the style of Van Gogh's Starry Night. The background is a detailed landscape of rolling hills under a starlit night sky.
--ar 105:128 --v 6.1

Cảm ơn bạn đã đọc đến đây! Nếu bạn thấy hữu ích hay thú vị, hãy giúp lan tỏa bản tin này đến bạn bè hoặc người quen của bạn nhé!

Chúc bạn một ngày vui vẻ và nhiều năng lượng~!

Reply

or to participate.