Hound : ผู้ช่วยเสมือนจริง ท้าทาย Siri และ Google Now
คำที่ถูกค้นบ่อย
    Sanook//s.isanook.com/sr/0/images/logo-new-sanook.png60060
    //s.isanook.com/hi/0/ud/281/1405301/4.jpgHound : ผู้ช่วยเสมือนจริง ท้าทาย Siri และ Google Now

    Hound : ผู้ช่วยเสมือนจริง ท้าทาย Siri และ Google Now

    2016-04-08T15:34:21+07:00
    แชร์เรื่องนี้

    คอลัมน์ IT.Talentz โดย siripong@kidtalentz.com

    ผู้ช่วยเสมือนจริงหรือเวอร์ชวล แอสซิสแตนต์ (Virtual Assistant) น่าจะเริ่มกลายเป็นสิ่งคุ้นเคยของคนสมัยนี้มากขึ้น เราอาจยกโทรศัพท์ขึ้นมาเพื่อถามคำถามบางอย่าง หรือขอให้ทำงานให้ได้โดยไม่ยากอะไรนัก เช่น เปิดเพลง เปิดวิดีโอ จัดนัดหมาย ฯลฯ

    ในตลาดมีผู้ช่วยเสมือนจริงของขาใหญ่วางอยู่เต็มแผงจนเหมือนไม่มีทางที่เจ้าอื่นจะเบียดแทรกเข้ามาได้แอปเปิลมี"สิรี"กูเกิลมีกูเกิลนาว วินโดวส์มี คอร์แทนา และอเมซอนมี อเล็กซา

    แต่ผู้ช่วยเสมือนจริงเหล่านี้ก็ยังอยู่ในระยะเริ่มต้น ไม่ได้สมบูรณ์แบบเหมือนในอุดมคติที่เราอยากให้เป็นจึงไม่แปลกที่แม้รายใหญ่เหมือนจะครอบคลุมตลาดบนพื้นฐานของการที่แต่ละรายเป็นเจ้าของระบบปฏิบัติการก็ยังมีรายอื่นที่ต้องการท้าทาย

    Soundhoundเป็นหนึ่งในนั้นจากบริษัทที่เริ่มต้นจากการพัฒนาเทคโนโลยีด้านการค้นหาเสียงและการจดจำเสียงนำไปสู่โมบายแอปพลิเคชั่นค้นหาเพลงที่มีชื่อเสียงมียอดผู้ใช้กว่า10 ล้านและเป็นบริษัทแรกที่ส่งอุปกรณ์สวมใส่ที่มีคุณสมบัติด้านเพลงเป็นเจ้าแรก รวมถึงเป็นรายแรกที่ให้บริการด้านจดจำเพลงติดไปกับรถยนต์

    การค้นหาเพลงด้วยซาวนด์ฮาวนด์นั้น นอกจากค้นแบบพื้น ๆ ด้วยการระบุชื่อเพลง ศิลปิน ผู้แต่งแล้ว ที่โดดเด่นก็คือการค้นด้วยเสียงเพลง ร้องเพลง ฮัมเพลง จากบางส่วนของเพลงที่บันทึกไว้ เช่น ไปได้ยินเพลงที่กำลังเปิดอยู่แล้วบันทึกไว้เพื่อจะค้นดูว่าเพลงนั้นเป็นเพลงอะไรจะได้ฟังเต็ม ๆ หรือนึกทำนองเพลงขึ้นมาได้บางส่วน ก็ฮัมเพื่อให้มันค้นหาเพลงเต็ม ๆ ให้

    ความเชี่ยวชาญด้านออดิโอ รีคอกนิชั่น ที่สั่งสมมา กลางปี 2015 ซาวนด์ฮาวนด์เริ่มทดสอบผู้ช่วยเสมือนจริงเวอร์ชั่นไพรเวต เบต้า Hound โดยใช้เทคโนโลยีสปีช ทู มีนนิ่ง ซึ่งผสมผสานเทคโนโลยีวอยซ์ รีคอกนิชั่นเข้ากับการประมวลผลภาษาธรรมชาติทำให้ผู้ช่วยเสมือนจริงเข้าใจคำพูด ที่ซับซ้อนกว่าของเจ้าอื่น ซึ่งยังอยู่บนพื้นฐานของเท็กซ์-ทู-สปีช และสปีช-ทู-เท็กซ์

    โดยสรุปคือ การจับความหมายของคำพูดได้ทันที ต่างจากเทคโนโลยีที่ใช้กันอยู่ ไม่ว่าจะเป็นแอปเปิลหรือกูเกิลที่จะแปลงเป็นเท็กซ์ก่อนเพื่อจะเข้าใจความหมาย

    หลังเป็นไพรเวต เบต้าได้ระยะหนึ่ง ก็เปิดตัวสู่สาธารณะ มีให้โหลดใช้ทั้ง iOS และแอนดรอยด์ จุดเด่น คือ การหาคำตอบให้ได้อย่างรวดเร็วจากความสามารถในการเข้าใจประโยคที่ซับซ้อนมากกว่า อย่างเช่น ที่ซีอีโอของบริษัทยกตัวอย่างเอาไว้เมื่อไม่นานมานี้ เช่น "When is the sun going to rise two days before Christmas in 2021 in Tokyo, Japan ?" หรือ How many days are there between the day after tomorrow and three days before the second Thursday of November of 2022

    ความสามารถเข้าใจภาษาธรรมชาติได้เช่นนี้ ช่วยให้คนใช้งานผู้ช่วยเสมือนจริงได้ราบรื่นกว่าการต้องพยายามใช้ประโยคที่รวบรัดง่ายดายที่สุด ดูแล้วก็น่าจะสะดวกกับผู้ใช้งานมากขึ้นกว่าของเจ้าอื่น ๆ แต่ปัญหาคือผู้ช่วยเสมือนจริงของเหล่ายักษ์ใหญ่ทั้งหลายนั้นมันฝังมากับระบบปฏิบัติการ แอปพลิเคชั่นพื้นฐานก็ถูกกำหนดค่าปริยายไว้รองรับผู้ช่วยเสมือนจริงของแต่ละเจ้าอยู่แล้ว นี่ย่อมเป็นอุปสรรคใหญ่ของรายอื่น ๆ ที่จะแทรกเข้าไป

    เว้นแต่ของดีจริงเท่านั้นจึงจะเบียดเข้าไปได้ ซึ่งก็มีบางกรณีที่เกิดขึ้นได้จริง เช่น กูเกิลแมปบน iOS

    ซาวนด์ฮาวนด์อาจจะพิสูจน์ตัวเองแบบนั้นก็ได้