Gemini 3.5 Live Translate มาแล้ว แปลเสียงพูดสดลื่นขึ้น รองรับ Google Translate และ Google Meet

Gemini 3.5 Live Translate มาแล้ว แปลเสียงพูดสดลื่นขึ้น รองรับ Google Translate และ Google Meet

Gemini 3.5 Live Translate มาแล้ว แปลเสียงพูดสดลื่นขึ้น รองรับ Google Translate และ Google Meet
แชร์เรื่องนี้
แชร์เรื่องนี้LineTwitterFacebook

ในที่สุด Google เปิดตัว Gemini 3.5 Live Translate โมเดลใหม่สำหรับการแปลเสียงพูดแบบเรียลไทม์ หรือ Speech-to-Speech Translation ที่ออกแบบมาให้การแปลสดมีความลื่นไหลและเป็นธรรมชาติมากขึ้น พร้อมเริ่มใช้งานกับ Google Translate และเตรียมขยายสู่ Google Meet

Gemini 3.5 Live Translate เป็นโมเดลแปลเสียงพูดสดรุ่นใหม่ของ Google ที่ออกแบบมาเพื่อแก้จุดอ่อนของระบบแปลภาษาสดแบบเดิม ซึ่งมักต้องรอให้ผู้พูดพูดจบก่อน แล้วระบบจึงค่อยแปลออกมา แต่โมเดลใหม่นี้สามารถสร้างเสียงแปลได้อย่างต่อเนื่อง ทำให้การสนทนามีความลื่นไหลขึ้น ลดช่วงเงียบหรือจังหวะหน่วงที่ทำให้การพูดคุยดูไม่เป็นธรรมชาติ

การปรับปรุงครั้งสำคัญคือการเพิ่มระบบแปลภาษาสดแบบเดิมมักทำงานแบบ Turn-by-turn คือรอผู้พูดพูดจบก่อนจึงเริ่มแปล ซึ่งแม้จะแปลได้ถูกต้องขึ้นในบางกรณี แต่ทำให้บทสนทนามีช่วงเว้นวรรคและขาดความต่อเนื่อง

 gemini-3.5-live-translate_bat

ทำให้ Gemini 3.5 Live Translate ใช้วิธีสร้างเสียงแปลอย่างต่อเนื่อง โดยพยายามหาสมดุลระหว่างการรอข้อมูลบริบทเพื่อแปลให้ถูกต้อง และการแปลให้ทันจังหวะของผู้พูด ส่งผลให้เสียงแปลตามหลังผู้พูดเพียงไม่กี่วินาที

เรื่องจำนวนภาษาที่รองรับนั้น Google ระบุว่า Gemini 3.5 Live Translate สามารถตรวจจับภาษาได้มากกว่า 70 ภาษา ทำให้รองรับการใช้งานในสถานการณ์จริงได้กว้างขึ้น ไม่ว่าจะเป็นการเดินทาง ประชุมข้ามประเทศ เรียนออนไลน์ หรือพูดคุยกับคนต่างภาษา

เมื่อเทียบกับระบบเดิมที่รองรับภาษาน้อยกว่า การรองรับมากกว่า 70 ภาษาถือเป็นก้าวสำคัญ โดยเฉพาะใน Google Meet ที่จะช่วยปลดล็อกการประชุมหลายภาษาได้มากขึ้น

สำหรับใครอยากลองใช้ตอนนี้ Gemini 3.5 Live Translate เริ่มปล่อยให้ใช้งานผ่านแอป Google Translate บน Android และ iOS แล้ว โดยผู้ใช้สามารถแตะปุ่ม Live translate ที่มุมซ้ายล่างของแอปเพื่อเริ่มใช้งาน

เงื่อนไขสำคัญคือ Google ระบุว่าฟีเจอร์นี้ออกแบบมาให้ใช้งานร่วมกับหูฟัง เพื่อให้ผู้ใช้ฟังเสียงแปลได้ชัดเจนและเป็นส่วนตัวมากขึ้น

แต่ว่าสำหรับผู้ใช้ Android แอป Google Translate กำลังทยอยเพิ่มโหมดใหม่ชื่อ Listening Mode ซึ่งช่วยให้ฟังคำแปลผ่านลำโพงสนทนาของโทรศัพท์ได้โดยตรง รูปแบบการใช้งานคล้ายการคุยโทรศัพท์ทั่วไป ผู้ใช้สามารถยกมือถือแนบหูเพื่อฟังคำแปลได้ทันที เหมาะกับสถานการณ์ที่ไม่มีหูฟังติดตัว หรือไม่สะดวกเปิดเสียงออกลำโพงภายนอก

ขยายไปยัง Google Meet

นอกจาก Google Translate แล้ว Gemini 3.5 Live Translate ยังเตรียมขยายสู่ Google Meet ด้วย โดยจะช่วยให้การประชุมวิดีโอคอลข้ามภาษาทำได้ง่ายขึ้น เดิมทีฟีเจอร์ Speech Translation ใน Google Meet รองรับเพียง 5 ภาษา แต่เมื่อใช้ Gemini 3.5 Live Translate จะรองรับมากกว่า 70 ภาษา และเปิดทางให้เกิดชุดภาษาที่ใช้ร่วมกันได้มากกว่า 2,000 รูปแบบ ภายในการประชุมเดียว

จุดที่น่าสนใจคือ Google Meet จะไม่จำกัดการแปลแบบเข้า-ออกภาษาอังกฤษเท่านั้นเหมือนเดิม แต่สามารถรองรับการแปลระหว่างภาษาต่าง ๆ ได้หลากหลายขึ้น

ตัวอย่างเช่น ผู้พูดภาษาญี่ปุ่นอาจสื่อสารกับผู้ฟังภาษาไทยหรือฝรั่งเศสได้สะดวกขึ้น หากระบบรองรับคู่ภาษานั้นในช่วงเปิดให้ใช้งานจริง ซึ่งช่วยให้การประชุมระดับนานาชาติมีความยืดหยุ่นมากกว่าเดิม

ที่สำคัญสำหรับ Google Meet ฟีเจอร์ Gemini 3.5 Live Translate จะเริ่มเปิดใช้งานแบบ Private Preview ในเดือนนี้ สำหรับลูกค้า Google Workspace บางกลุ่มที่ได้รับเลือกก่อน Google ระบุว่าจะมีการขยายการใช้งานในวงกว้างมากขึ้นภายในช่วงปลายปีนี้ ซึ่งหมายความว่าผู้ใช้ทั่วไปหรือองค์กรจำนวนมากอาจต้องรออีกสักระยะก่อนใช้งานจริง

นอกจากการใช้งานผ่าน Google Translate และ Google Meet แล้ว Gemini 3.5 Live Translate ยังเปิดให้ใช้งานแบบ Public Preview สำหรับนักพัฒนาผ่าน Gemini Live API และ Google AI Studio ส่วนนี้น่าสนใจสำหรับนักพัฒนาแอปหรือบริการที่ต้องการใส่ความสามารถแปลเสียงสดเข้าไปในผลิตภัณฑ์ของตัวเอง เช่น แอปประชุม แอปเรียนภาษา ระบบคอลเซ็นเตอร์ หรือบริการท่องเที่ยว

ด้านความปลอดภัย Google ระบุว่าเสียงที่สร้างจาก Gemini 3.5 Live Translate จะถูกฝังลายน้ำด้วย SynthID ซึ่งเป็นลายน้ำที่มองไม่เห็นและตรวจจับได้ในเสียงที่ AI สร้างขึ้นแนวทางนี้มีเป้าหมายเพื่อช่วยให้สามารถตรวจสอบได้ว่าเสียงใดถูกสร้างโดย AI ลดความเสี่ยงด้านข้อมูลเท็จหรือการนำเสียง AI ไปใช้งานในทางที่ผิด

ดังนั้นแล้ว Gemini 3.5 Live Translate เป็นก้าวใหม่ของ Google ในการแปลเสียงพูดสด โดยเริ่มใช้งานกับ Google Translate บน Android และ iOS แล้ว พร้อมเตรียมขยายสู่ Google Meet สำหรับลูกค้า Google Workspace บางกลุ่มในรูปแบบ Private Preview

จุดเด่นคือรองรับมากกว่า 70 ภาษา แปลแบบต่อเนื่อง ลื่นไหลขึ้น และเสียงที่สร้างด้วย AI จะถูกฝังลายน้ำ SynthID เพื่อช่วยลดความเสี่ยงด้านการใช้งานผิดวัตถุประสงค์ ก็ลองคิดให้ดีก่อนใช้นะ

แชร์เรื่องนี้
แชร์เรื่องนี้LineTwitterFacebook
กำลังโหลดข้อมูล