Tacotron 2 ระบบสร้างเสียงพูดด้วย AI เสียงเหมือนมนุษย์จนแทบแยกไม่ออก

Advertisement
ข่าวไอทีอัพเดทวงการเทคโนโลยีของเราในวันนี้มีมาฝากกันอีกแล้วครับ ข่าวคราวและข้อมูลที่นา่สนใจนั้นยังคงมีมาให้ได้ติดตามกันตลอดเช่นเคย หากพูดถึงเสียงพูดจากคอมพิวเตอร์หลายคนน่าจะคุ้นเคยกับเสียงห้วนๆ เรียบๆ ไร้อารมณ์ทั้งจาก google และ Siri ที่ฟังแล้วชวนให้สงบนิ่งเหลือเกิน แต่อย่างไรก็ตาม หลายๆ เจ้าก็ยังคงพยายามพัฒนาให้เสียงพูดเหล่านี้เหมือนกับเสียงมนุษย์มากที่สุด และมันก็เป็นผลแล้วเมื่อทางวิศวกรของ google ทีมหนึ่งได้ทำการตีพิมพ์เอกสารนำเสนอระบบสร้างเสียงพูดตัวใหม่ ที่มีชื่อว่า  Tacotron 2 บอกเลยว่าฟังแล้ว แยกไม่ออกจริงๆ ว่าอันไหนเสียงมนุษย์ อันไหนเสียงจากระบบ

 

สำหรับ Tacotron 2  เป็นระบบที่จะสร้าง spectrogram หรือ รูปแบบที่แสดงให้เห็นว่าควรที่จะมีคำพูดแต่ละคำนั้นควรจะมีเสียงอย่างไร แล้วนำรูปแบบนี้ไปผ่านอัลกอริทึม WaveNet  ของ google ทำให้ได้เสียงที่เหมือนเสียงมนูษย์มากๆ โดยทางนักวิจัยนั้นระบุว่า  Tacotron 2  ได้คะแนนเสียงพูด Mean Opinion Score (MOS) ที่ 4.53  สว่นเสียงพูดจากมนุษย์ที่แัดมาเป็นอย่างดีได้คะแนนที่  4.58 สำหรับ MOS นั้นเป็นคะแนนวัดว่าเสียงใดๆ มีความเป็นธรรมชาติมากแค่ไหน tacotron-2


อ่านมาถึงตรงนี้หลายคนน่าจะอยากได้ยินเสียงที่ว่าแล้ว เข้าไปฟังประโยคสั้นๆ จากเสียงของ Tacotron 2 กับเสียงมนุษย์ เปรียบเทียบกันได้ที่เว็บไซต์นี้ครับ tacotron  เลื่อนลงไปล่างสุดตรงหัวข้อ Tacotron 2 or Human?  ฟังเทียบเลย มาดูว่าคุณจะฟังออกหรือไม่ว่าเสียงไหนเสียงมนุษย์ เสียงไหนเสียงของ  Tacotron 2 แล้วไปดูเฉลยฉได้ที่  Inc.

ที่มา : Inc.,blognone

แสดงความเห็น