แนวคิดใหม่ของ "การพูดคุยกับทีวีของคุณ"

แนวคิดใหม่ของ "การพูดคุยกับทีวีของคุณ"

การโต้ตอบด้วยเสียง

ฟังก์ชันการโต้ตอบด้วยเสียงช่วยให้คุณใช้งานทีวีด้วยเสียงของคุณ ซึ่งทำให้สามารถสลับจากหน้าจอรายการทีวีเป็นหน้าจอหลักของฉัน หรือค้นหาเว็บโดยไม่มีการทำงานที่ซับซ้อน ในที่นี้เราจะพูดคุยเกี่ยวกับอินเทอร์เฟซผู้ใช้ (UI) กับวิศวกรที่พัฒนา UI เหล่านี้

lm_5_4_lc_01_131210
lm_5_4_lc_02_131210

ขอเริ่มต้นด้วยคำถามว่าการโต้ตอบด้วยเสียงคืออะไร

Yokohagi: ชื่อของมันบอกอยู่แล้วว่าคือฟังก์ชันที่ช่วยให้คุณใช้งานทีวีด้วยเสียงของคุณ ผู้ใช้เพียงพูดคำสั่งหรือค้นหาคำและพูดใส่ในตัวควบคุมทัชแพ็ดหรือสมาร์ทโฟน* ซึ่งเป็นรูปแบบการใช้งานที่ง่ายและสะดวกสบายอย่างมาก
* "ต้องติดตั้ง "TV Remote 2" สำหรับการใช้สมาร์ทโฟน

- ค้นหาเนื้อหา
- ป้อนข้อความ
- การเคลื่อนที่ไปรอบๆ เว็บและการถ่ายทอดข้อความออกมาเป็นเสียง
- สามารถใช้การทำงานแบบเดิมได้ด้วย
(การใช้งานเพิ่มเสียง/ลดเสียงโดยตรง เปลี่ยนช่อง ฯลฯ)

 

พวกคุณเริ่มพัฒนาฟังก์ชันนี้อย่างไร

Yokohagi: เราเริ่มจากฟังก์ชันการแนะนำด้วยเสียงสำหรับตลาดญี่ปุ่น 2010 ฟังก์ชันนี้จะบอกสิ่งต่างๆ กับผู้ดูด้วยเสียง เช่น ช่องที่เลือกและชื่อรายการทีวีที่ดูอยู่ โดยพัฒนาขึ้นเพื่อทำให้การใช้ทีวีสะดวกสบายยิ่งขึ้นสำหรับผู้ใช้ที่ความสามารถในการมองเห็นบกพร่อง

เริ่มจากรุ่นใหม่ในปี 2013 เราได้ขยายฟังก์ชันนี้ครอบคลุมมากกว่า 20 ภาษา ในช่วงเวลานี้ เราประชุมกันหลายครั้งเพื่อพิจารณาอินเทอร์เฟซผู้ใช้รุ่นใหม่ ความสะดวกสบายของการโต้ตอบด้วยเสียงถือกำเนิดขึ้นจากการประชุมเหล่านี้ และมีการตัดสินใจว่าแทนที่จะเสนอการแนะนำด้วยเสียงเท่านั้น เราควรเสนอการใช้ทีวีในรูปแบบใหม่โดยสิ้นเชิงซึ่งผู้ใช้ปกติสามารถใช้งานทีวีด้วยเสียงได้เช่นเดียวกัน

ขณะที่เราดำเนินการเพื่อทำให้แนวคิดนี้เป็นรูปธรรมยิ่งขึ้น เราต้องเผชิญคำถามมากมาย เช่น "ผู้ใช้สามารถทำอะไรกับการโต้ตอบด้วยเสียงได้บ้าง" และ "ผู้ใช้ควรพูดว่าอะไร" เนื่องจากเราได้เปลี่ยนแปลงแนวคิดเกี่ยวกับทั้งทีวีและรีโมทคอนโทรลขนานใหญ่ด้วยการใช้คำสั่งเสียงในการทำทุกสิ่งที่ก่อนหน้านี้ทำด้วยการกดปุ่มบนรีโมทคอนโทรล เราจึงพบว่าตัวเองอยู่ในโลกใหม่ที่ไม่รู้จัก

มีการปรับปรุงสำคัญบางอย่างกับรีโมทคอนโทรลด้วยใช่หรือไม่

Sekito: ใช่ครับ การปรับปรุงมากมายที่ทำไปแล้วกับรีโมทคอนโทรลแบบเดิมทำให้การถือและการใช้งานง่ายดายขึ้น อย่างไรก็ตาม บางรุ่นมีปุ่มถึง 50 ปุ่ม ซึ่งมีผู้แสดงความคิดเห็นมาถึงเราว่ารีโมทใช้งานยาก และผู้ใช้บางคนบอกว่าไม่สามารถใช้ได้อย่างมีประสิทธิภาพ

ปี 2012 เราได้พัฒนาตัวควบคุมทัชแพ็ดที่ลดจำนวนปุ่มลงอย่างมากและวางตลาดในปีเดียวกัน

รีโมท "ไร้ปุ่ม" ใหม่นี้แตกต่างจากรีโมทแบบเดิมโดยสิ้นเชิง ผู้ใช้หมุนส่วนกลางทัชแพ็ดด้วยนิ้วโป้ง ทำให้การใช้งานง่ายขึ้นเหมือนเมาส์บนพีซี

ปี 2012 รีโมทคอนโทรลใหม่ออกวางตลาดด้วยวัตถุประสงค์ในการทำให้ใช้งานได้ง่ายขึ้น ยิ่งไปกว่านั้นในรุ่นปี 2013 ยังมีการติดไมโครโฟนในตัวเพื่อให้ผู้ใช้สามารถใช้งานด้วยเสียง ไม่จำเป็นต้องบอกว่าการใช้งานรีโมทคอนโทรลแบบเดิมง่ายดายอยู่แล้ว แต่ขณะเดียวกัน รีโมทคอนโทรลจำเป็นต้องใช้เป็นไมโครโฟนได้ด้วย ซึ่งเป็นการนำสองฟังก์ชันมารวมในอุปกรณ์เดียว แต่เพื่อให้แน่ใจว่าผู้ใช้จะไม่สับสนเกินไปในการใช้งานเป็นไมโครโฟนหรือรีโมท เราจึงทำงานกันอย่างหนักเพื่อทำให้อุปกรณ์นี้ทำงานอย่างเป็นธรรมชาติและง่ายดายสำหรับทุกคนที่ใช้

Koganei: เราเริ่มจากการศึกษาฟังก์ชันการควบคุมด้วยเสียงเพื่อเปลี่ยนระดับเสียงและช่องด้วยคำสั่งเสียงที่มีอยู่ของคู่แข่ง และเราไตร่ตรองว่าฟังก์ชันเหล่านั้นเป็นสิ่งที่ผู้ใช้ต้องการใช้งานด้วยเสียงจริงหรือไม่
เหนือสิ่งอื่นใด การใช้งานด้วยเสียงสำหรับทีวียังคงเป็นแนวคิดใหม่และผู้ใช้ไม่เคยคิดถึงเรื่องนี้มาก่อน ถ้าจู่ๆ เราบอกว่า "ลองพูดกับทีวีดูสิ" หรือ "ใช้งานทีวีด้วยเสียงของคุณ" ผู้ใช้อาจไม่รู้ด้วยซ้ำว่าจะพูดอะไร ซึ่งจะทำให้สับสน และแน่นอนว่าเราไม่อยากทำให้ผู้ใช้สับสนแบบนั้น

Konuma: ดังนั้น เราจึงเริ่มคิดถึงสถานการณ์ที่ผู้ใช้ต้องการใช้ไมโครโฟน ผลลัพธ์คือเราทุกคนเห็นตรงกันว่าไมโครโฟนจะมีความสะดวกสบายที่สุดเมื่อผู้ใช้ค้นหาบนเว็บ

อะไรคือคุณสมบัติของอุปกรณ์จดจำเสียง

Koganei: พูดง่ายๆ คืออุปกรณ์ของเรามีสมองสองส่วน
จุดแข็งของฟังก์ชันเสียงของเราคือสมองสองส่วนที่ทำงานร่วมกันอย่างดี

ตัวอย่างเช่นมีการออกคำสั่งแบบตายตัวสำหรับการทำงานพื้นฐานของทีวี เช่น "เพิ่มเสียง" เราเรียก "คำตายตัว" เหล่านี้และคำเหล่านี้จะถูกจัดเก็บในสมองส่วนหนึ่ง แล้วก็มีคำที่ผู้ใช้สามารถใช้ได้ตามใจชอบ ซึ่งสะดวกสบายสำหรับกรณีเช่น การค้นหา เราเรียก "คำทั่วไป" เหล่านี้และคำเหล่านี้จะถูกจัดเก็บในสมองอีกส่วนหนึ่ง คุณสมบัติหลักของอุปกรณ์ของเราคือ สามารถเริ่มทำงานด้วยสมองทั้งสองส่วนๆ หนึ่งมีพจนานุมกรมคำตายตัว และอีกส่วนมีบริการ cloud ที่จดจำคำทั่วไป หรือจะเรียกว่าอุปกรณ์พันทางก็ได้ ซึ่งช่วยให้อุปกรณ์จดจำคำที่ผู้ใช้พูดจากธนาคารข้อมูลขนาดใหญ่

โดยปกติแล้วเมื่อผู้ใช้ต้องการใช้งานทีวี เช่น "เพิ่มเสียง" จะมีเพียงระบบพจนานุกรมคำตายตัวที่อยู่ในทีวีเท่านั้นที่เริ่มทำงาน เช่นเดียวกัน เมื่อผู้ใช้ต้องการป้อนคำค้นหา ระบบจดจำคำทั่วไปเท่านั้นที่เริ่มทำงาน อย่างไรก็ตาม นี่หมายความว่าอุปกรณ์ไม่สามารถเรียกคืนคำหลักจากรายการทีวีที่ดูจากระบบจดจำคำทั่วไปในขั้นตอนการพูดครั้งเดียว ซึ่งไม่สะดวกสบายเอาเลย

A) “ค้นหาเว็บ” -› [โปรดพูดคำหลัก] -› “Panasonic”
B) “ค้นหา Panasonic ตามเว็บ”

ด้วยอุปกรณ์ของเรา ระบบพจนานุกรมคำตายตัวและระบบจดจำคำทั่วไปจะทำงานทั้งสองส่วน จึงจดจำทั้งคำสั่งในการใช้งานทีวีและวลีค้นหาคำทั่วไป เราคำนึงถึงประสิทธิภาพที่ดีเยี่ยมนี้ตลอดการพัฒนาของเราเพื่อทำให้ฟังก์ชันนี้สะดวกสบายสำหรับผู้ใช้มากที่สุด

Konuma:
ตัวอย่างเช่นเมื่อเราต้องการดู "ภาพดอกไม้" การต้องพูดว่า "ค้นหา" ก่อนทุกครั้งไม่ถือว่าสะดวกสบายเลย เราต้องการสร้างระบบที่จะจดจำสิ่งที่คุณค้นหาได้ง่ายขึ้นด้วยการพูดคำนั้นเท่านั้น ผลลัพธ์คือทั้งหมดที่คุณต้องทำกับระบบของเราคือ พูดคำว่า "ดอกไม้" ลงในไมโครโฟนเท่านั้น หลังจากพูดคำว่า "ดอกไม้" แล้ว ทีวีจะตอบสนองด้วยการสอบถามเงื่อนไขเพิ่มเติม เช่น "คุณต้องการภาพถ่ายหรือวิดีโอ"

พวกคุณนำเสนอความแม่นยำแบบนั้นสำหรับภาษาต่างๆ ใช่หรือไม่

Yokohagi: ครับ เราทำงานหนักมากในการพัฒนาภาษา นอกจากนี้เรายังตรวจสอบความเข้ากันได้กับภาษาสำหรับมากกว่า 20 ประเทศ ซึ่งถือเป็นงานยักษ์ นอกจากการตรวจสอบคุณภาพ "การถ่ายทอดข้อความออกมาเป็นเสียง" อย่างรอบคอบแล้ว เรายังต้องตรวจสอบอย่างใกล้ชิดที่สุดว่าคำตายตัวและคำทั่วไปคำใดที่ผู้ใช้มีแนวโน้มเลือกใช้เมื่อพูด ตัวอย่างเช่น "หน้าจอหลักของฉัน" เป็นคำตายตัวแต่ก็เป็นคำสั่งที่ใช้ทั่วไปด้วยเช่นกัน ดังนั้น คำสั่ง "หน้าจอหลักของฉัน" จึงถูกตั้งค่าให้นำเสนอการตอบสนองที่ถูกต้องในทุกภาษา นอกจากการตั้งค่าทั่วไปประเภทนี้ เรายังจัดหาการตอบสนองอย่างละเอียดและแม่นยำมากกับการใช้คำในแต่ละภาษา

Konuma: อัตราการจดจำมีแนวโน้มลดลงในบางกรณี ขึ้นอยู่กับภาษา เมื่อมีปัญหาเกิดขึ้น เราจะทำงานอย่างขมักเขม้นเพื่อตรวจสอบและหาเหตุผลว่าปัญหามาจากไมโครโฟนหรือพจนานุกรมในตัวในทีวี หรือสาเหตุอื่นๆ

 

สิ่งใดทำให้อัตราการจดจำลดลงอย่า่งมาก

Konuma: นี่เป็นเพียงตัวอย่างหนึ่ง แต่เรามีความยุ่งยากในขั้นตอนการพัฒนากับคำ เช่น ตัวเลข ที่สามารถอ่านได้หลายแบบ ตัวอย่างเช่น ในภาษาอังกฤษ เราสามารถออกเสียงตัวเลข "223" เป็น "สอง-ยี่สิบ-สาม" หรือ "สองร้อยยี่สิบสาม" สถานการณ์แบบเดียวกันนี้มีอยู่ในทุกภาษา ปัญหาคือวิธีที่คุณออกเสียงคำๆ นั้น และวิธีที่ระบบจดจำคำนั้น ในขั้นตอนต้นแบบเบื้องต้น ระบบไม่สามารถจดจำตัวเลขไต้หวันได้ด้วยเหตุผลนี้ ในภาษาฝรั่งเศส ระบบตัวเลขยิ่งซับซ้อนมาก “70” จะออกเสียงว่า “60+10” และ“80” ออกเสียงว่า “4x20” เป็นเรื่องยากอย่างยิ่งที่จะเพิ่มความแม่นยำของพจนานุกรมสำหรับภาษาที่ใช้นิพจน์ประเภทเหล่านี้

เนื่องจากไม่มีคนที่สามารถเข้าใจภาษาของ 20 ประเทศได้ ถ้าเช่นนั้นพวกคุณตรวจสอบภาษาเหล่านั้นอย่างไร

Yokohagi: เรื่องนี้ค่อนข้างยากนิดหน่อย แต่เราแสดงคำสั่งในการควบคุมสำหรับแต่ละภาษาบนพีซี และตั้งค่าให้พีซีถ่ายทอดข้อความนั้นเป็นเสียง ซึ่งจะถูกป้อนเข้าสู่ขั้นตอนการพัฒนาทีวีเพื่อทำการตรวจสอบ สุดท้าย เราขอให้พนักงานท้องถิ่นของ Panasonic ในแต่ละประเทศตรวจสอบผลลัพธ์ และรับฟังความคิดเห็นจากคนเหล่านั้น

Koganei: วิธีนี้เกี่ยวข้องกับข้อความจำนวนมากมายมหาศาล และต้องมีการทำงานมากมายเหลือเชื่อแต่ไม่สามารถหลีกเลี่ยงได้ หากคุณกำลังจะใช้การจดจำเสียงในรูปอินเทอร์เฟซผู้ใช้ เราจึงทำการปรับอย่างละเอียดครั้งแล้วครั้งเล่าเพื่อเพิ่มความแม่นยำ

พวกคุณจัดการการพัฒนารีโมทคอนโทรลอย่างไร เนื่องจากเป็นเครื่องมือสำคัญสำหรับการจดจำเสียง

Sekito: อย่างที่ผมกล่าวไปแล้วตอนต้น เราพัฒนาตัวควบคุมทัชแพ็ดไร้ปุ่มในปี 2012 สำหรับเวอร์ชันปัจจุบัน เราได้เพิ่มฟังก์ชันควบคุมด้วยเสียงลงไป ผลลัพธ์คือ เรามีทีมวิศวกรที่รับผิดชอบด้านฮาร์ดแวร์ในการผลิตรีโมทคอนโทรล และวิศวกรอีกทีมที่รับผิดชอบซอฟต์แวร์เพื่อทำให้ทีวีทำงานด้วยเสียงอย่างราบรื่น สองทีมร่วมมือกันเพื่อบรรลุเป้าหมายเดียว

 

การพัฒนาการโต้ตอบด้วยเสียงดำเนินการกันเป็นครั้งแรก จึงน่าจะเป็นงานที่ยุ่งยากมากเลยใช่หรือไม่

Imai: ยากจริงๆ ครับ แต่การทำงานเป็นทีมช่วยให้เราเอาชนะความยุ่งยากนั้นมาได้ โดยทั่วไปแล้วทีมงานด้านฮาร์ดแวร์และทีมงานด้านซอฟต์แวร์จะทำงานแยกกัน อุปกรณ์รีโมทคอนโทรลพัฒนาโดยแผนกฮาร์ดแวร์ และ GUI ของทีวีพัฒนาโดยแผนกซอฟต์แวร์ ครั้งนี้เนื่องจากรีโมทคอนโทรลเป็นส่วนสำคัญ และเป้าหมายคือเพิ่มความสะดวกสบายของผู้ใช้ และปรับปรุงประสบการณ์การใช้งานทีวีโดยรวม จึงมีการคัดเลือกสมาชิกจากแต่ละแผนกเพื่อตั้งเป็นทีมเดียว ซึ่งทำให้สามารถรวมเทคโนโลยีจากทุกแผนกขณะที่ทีมงานดำเนินการเพื่อสร้างต้นแบบ

จุดที่ยากคือการกำหนดเป้าหมาย การโต้ตอบด้วยเสียงและการรวมไมโครโฟนเป็นบริบทใหม่โดยสิ้นเชิง ซึ่งแตกต่างจากบางอย่างเช่น วิศวกรรมคุณภาพภาพที่เป้าหมายมองเห็นได้ง่ายในเชิงเปรียบเทียบ นอกจากนั้นยังไม่มีเกณฑ์ที่ชัดเจนในการประเมินระหว่างการพัฒนา ซึ่งถือว่ายากมาก เนื่องจากยากที่จะตัดสินว่าเมื่อใดที่การพัฒนาเสร็จสิ้นสมบูรณ์

การเพิ่มไมโครโฟนในรูปทรงขนาดเล็กแบบเดิม และการรักษาคุณภาพในระดับสูงยากหรือไม่

Sekito: จุดที่ต้องประเมินสำหรับฟังก์ชันไมโครโฟนคืออัตราการจดจำเสียง ซึ่งประเมินโดยการใช้พารามิเตอร์ประสิทธิภาพ 3 ส่วน:

- ประสิทธิภาพระบบไร้สาย (การสื่อสารไม่ติดขัด)
- ประสิทธิภาพไมโครโฟน (ฟังก์ชันการเก็บบันทึกเสียง)
- ประสิทธิภาพระบบจดจำ (ความสามารถส่วนทีวีในการทำความเข้าใจความหมายของเสียง)

เริ่มแรกการออกแบบฮาร์ดแวร์มุ่งเน้นที่การสร้างประสิทธิภาพที่แข็งแกร่งสำหรับฟังก์ชันระบบไร้สายและไมโครโฟน และการออกแบบซอฟต์แวร์ที่พุ่งเป้าที่การปรับระบบจดจำในทีวี กุญแจสำคัญสำหรับความสำเร็จคือ การเพิ่มความสามารถมากที่สุดเท่าที่เป็นไปได้เมื่อพิจารณาถึงพื้นที่ที่จำกัดซึ่งเราต้องดำเนินการ

แต่การเพิ่มประสิทธิภาพไม่ใช่เป้าหมายเดียว สิ่งสำคัญยังรวมถึงการสร้างสมดุล ตัวอย่างเช่นเมื่อคุณเพิ่มความไวของไมโครโฟน ไมโครโฟนจะรับเสียงที่ไม่ได้รวมอยู่ในระบบด้วยซึ่งทำให้การทำงานผิดพลาด สิ่งสำคัญคือการรับเสียงที่จำเป็นเท่านั้น เช่น ในห้างที่เสียงดัง หรือเมื่อคนจำนวนมากส่งเสียงดังขณะดูภาพยนตร์เร้าใจ ในทางกลับกัน หากความแม่นยำของการเก็บบันทึกเสียงแคบมาก ผู้ใช้จะต้องพูดดังมาก ดังนั้น เราจึงต้องกำหนดเป้าหมายสำหรับระดับที่เหมาะสมที่มีสมดุลที่ดีเยี่ยม

Imai: ขณะที่ปรับพารามิเตอร์หลายร้อยพารามิเตอร์ผ่านการลองผิดลองถูก เราพบพารามิเตอร์ที่เหมาะสมบางอย่างสำหรับส่วนทีวี หลังจากตรวจสอบพารามิเตอร์เหล่านี้ซ้ำๆ เราจึงนำพารามิเตอร์ที่มีอัตราการจดจำสูงที่สุดมาใช้

แม้เรามั่นใจในการสร้างรีโมทคอนโทรล แต่นั่นเป็นความพยายามครั้งแรกของเราในการรวมไมโครโฟนเข้ากับรีโมทคอนโทรล ดังนั้น จึงถือเป็นการท้าทายใหม่โดยสิ้นเชิง ความที่ไม่มีตัวอย่างให้ทำตาม จึงยากที่จะตัดสินใจพื้นฐานข้อกำหนดเฉพาะสำหรับผลลัพธ์การตรวจสอบ นอกจากนั้นเรายังพิจารณาแนวทางมากมายเพื่อทำให้รูปทรงรีโมทง่ายต่อการใช้

ด้วยวิธีนี้ เราทำงานในการปรับปรุงทุกส่วน ซึ่งรวมถึงรูปทรง และทดสอบต้นแบบเป็นการภายในประมาณ 3-4 เดือนก่อนเปิดตัวผลิตภัณฑ์ นี่ยังเป็นครั้งแรกที่เรามีแขกที่มาร่วมหารือธุรกิจที่ใช้ฟังก์ชันใหม่นี้ เราได้รับความคิดเห็นที่น่าพอใจเป็นส่วนใหญ่ เช่น "ยอดเยี่มม!" และ "สะดวกมากๆ" ซึ่งทำให้เรามั่นใจว่ารีโมทคอนโทรลของเราจะประสบความสำเร็จ

อย่างไรก็ตาม ขณะที่ "ความสามารถในการใช้งานด้วยเสียง" ได้รับการประเมินในระดับสูง ยังมีบางส่วนที่ต้องเพิ่มความแม่นยำ ความที่สมาชิกทั้งหมดทำงานร่วมกัน เราจึงทุ่มเทความพยายามอย่างเต็มที่ที่สุดเพื่อดำเนินการการออกแบบให้เสร็จสิ้นตามกำหนดการผลิต

ผมเข้าใจว่ามีความสะดวกสบายไม่เฉพาะขณะค้นหาเท่านั้น แต่ยังรวมถึงขณะดูเว็บเบราเซอร์บนทีวีด้วยใช่หรือไม่

Nakaoka: ครับ ถูกต้องเลย หนึ่งในข้อดีที่สำคัญคือ สามารถแสดงข้อมูลเกี่ยวกับเว็บเบราเซอร์บนหน้าจอใหญ่และทุกคนใช้ร่วมกันได้

เราคิดว่าคงสะดวกมากหากมีเครื่องมือในการค้นหาบางสิ่งสำหรับกลุ่มคน แล้วใช้ข้อมูลบนหน้าจอเพื่อตัดสินใจ ตัวอย่างเช่น สามารถค้นหาแผนที่ได้ และทุกคนสามารถดูแผนที่เหล่านั้นเพื่อตัดสินใจว่าจะไปที่ไหน หรือสามารถตัดสินใจเมนูสำหรับมื้ออาหารขณะดูสูตรอาหารต่างๆ

ในการใช้รีโมทคอนโทรลดั้งเดิม สิ่งที่จำเป็นคือป้อนคำหลักทีละคำ ซึ่งยุ่งยากมาก ความสามารถในการป้อนคำหลักด้วยเสียงทำให้รีโมทคอนโทรลสะดวกสบายพอๆ กับสมาร์ทโฟนที่ทำงานด้วยเสียง ทีวีของเราช่วยให้คุณสามารถค้นหาคำด้วยการพูดคำนั้นเท่านั้น จากนั้นจึงติดตามผลลัพธ์การค้นหาโดยตรง การค้นหาด้วยเสียงเร็วกว่าการป้อนข้อความทีละตัวอักษรมาก ความลับของความรวดเร็วนี้คือ เว็บเบราเซอร์เริ่มทำงานในพื้นหลังและอยู่ในสถานะสแตนด์บาย ทันทีที่ออกเสียงคำกระตุ้นการทำงาน เว็บเบราเซอร์จะปรากฏในพื้นหลัง ซึ่งทำให้ระยะเวลาในการรับรู้ที่คำค้นหาจะปรากฏขึ้นลดลงอย่างมาก ซึ่งถือว่ายอดมาก เนื่องจากช่วยให้คุณค้นหาด้วยเสียงอย่างราบรื่นต่อหน้าทุกคน (หัวเราะ)

ความสามารถในการใช้ฟังก์ชันการถ่ายทอดด้วยเสียงกับเว็บเบราเซอร์เป็นความคืบหน้าสำคัญอีกข้อหนึ่ง โดยระบบจะตรวจจับโครงสร้างหน้าเว็บต่างๆ ทันที และตัดสินกระบวนการที่จะทำให้เข้าใจเนื้อหาจากที่ตั้งที่เลือกด้วยตัวชี้ได้ง่ายที่สุดอย่างแม่นยำ แม้เมื่อถ่ายทอดส่วนต่างๆ ด้วยเสียงด้วยประโยคจำนวนมาก เช่น บทความและบล็อกข่าว คุณจะสามารถได้ยินโดยปราศจากความเครียดใดๆ

ตลาดตอบสนองอย่างไรนับจากเปิดตัว

Imai: การตอบสนองยอดเยี่ยมมาก หลายคนพูดว่าความแม่นยำของการจดจำเสียงของ Panasonic ดีมากเมื่อเปรียบเทียบกับคู่แข่ง โดยเฉพาะลูกค้าในญี่ปุ่นที่ชมเราประมาณว่า "การโต้ตอบด้วยเสียงดีมาก ฉันอยากลองใช้การทำงานอื่นๆ ด้วย"

lm_5_4_lc_37_131210
lm_5_4_lc_40_1_131210

Daisuke Yokohagi
การแนะนำด้วยเสียงและวิวัฒนาการของฟังก์ชันนี้
วิศวกรซอฟต์แวร์
เข้าร่วมกลุ่มระบบยานยนต์และอุตสาหกรรมปัจจุบันในปี 1999
โอนย้ายสู่ส่วนการพัฒนาทีวีในปี 2006
พัฒนามิดเดิลแวร์ทีวีอินเทอร์แอคทีฟ เช่น Data Broadcasts สำหรับตลาดยุโรป

สิ่งที่อยากบอก...
มีฟังก์ชันพิเศษที่มีอยู่ใน WT600 และ WT60 เท่านั้น ซึ่งไฟ LED ตกแต่งจะติดสว่างตลอดส่วนล่างของเครื่องขณะที่ผู้ใช้ป้อนคำสั่งเสียง นี่เป็นเอฟเฟ็กต์ที่สวยงามมาก ผมคิดว่าเป็นเรื่องที่ดีที่ได้เห็นทีวีนำเสนอความคิดเห็นเป็นภาพกลับไปยังลูกค้า นอกจากนี้ยังตอบสนองแบบนี้กับการทำงานอื่นๆ นอกเหนือจากระหว่างการจดจำเสียงเท่านั้น ตัวอย่างเช่น เมื่อมีสายเรียกเข้าจาก Skype หรือเมื่อสัญญาณเตือนการตั้งเวลาดัง ลองดูสิครับ

lm_5_4_lc_40_2_131210

Tomohiro Koganei
การจดจำเสียง
วิศวกรซอฟต์แวร์
เข้าร่วมส่วนการพัฒนาทีวีปัจจุบันของ Panasonic ในปี 2001
พัฒนาแอปพลิเคชันซอฟต์แวร์สำหรับทีวี เช่น Data Broadcast Browsers และ TV Guides สำหรับตลาดญี่ปุ่นจากปี 2002 - 2011

สิ่งที่อยากบอก...
ระบบสามารถจดจำคำต่างๆ มากมายสำหรับคำสั่งเสียงคำสั่งเดียวกันเมื่อคุณค้นหา ตัวอย่างเช่น แม้มีคำว่า "Search for" ในคู่มือวิธีใช้การโต้ตอบด้วยเสียง แต่ระบบจะทำงานจากคำว่า "Look for" หรือ "Find" ด้วยเช่นกัน วิธีนี้มีเป้าหมายเพื่อจัดการกับรูปแบบต่างๆ ในนิพจน์ ผู้พูดที่เป็นเจ้าของภาษาในแต่ละภาษาได้รับการสนับสนุนจากการจัดหานิพจน์มากมาย ซึ่งได้รับการจดทะเบียนทั้งหมด
ดังนั้น เมื่อคุณใช้วลีคำสั่งค้นหาอื่นโดยไม่ตั้งใจ ระบบอาจเข้าใจและดำเนินการตามที่คุณต้องการ คุณน่าจะลองใช้คำสั่งต่างๆ 2-3 คำสั่งเพื่อดูว่าคำสั่งใดใช้ได้ (หัวเราะ)

lm_5_4_lc_40_3_131210

Tomohiro Konuma
การจดจำเสียง
วิศวกรซอฟต์แวร์
เข้าร่วมแผนก R&D ขององค์กรของ Panasonic ในปี 1993
วิจัยและพัฒนาเทคโนโลยีการจดจำเสียงพูดและการประมวลผลเสียงจากปี 1993 - 2012
ย้ายไป AVC Company ในปี 2012

สิ่งที่อยากบอก...
คำสั่งสำหรับทีวียังมีจุดประสงค์เพื่อจัดการกับรูปแบบต่างๆ ในนิพจน์ด้วย (อย่างไรก็ตาม มีข้อจำกัดบางอย่าง) โดยปกติแล้วสิ่งที่แสดงในคู่มือวิธีใช้จะใช้ได้ทั้งหมด แต่ทีวีถูกออกแบบให้จดจำตัวเลือกการออกเสียงบางตัวเลือกเมื่อคนใช้พูดไม่ชัดเจน

หากเป็นไปได้ เราอยากที่จะสามารถจัดการกับรูปแบบต่างๆ ในนิพจน์สำหรับภาษาทั้งหมดทั่วโลก แต่นี่คือเป้าหมายในอนาคต เราต้องการนำเสนอรูปแบบการพูดที่ครบถ้วนจริงๆ นั่นคือความฝันของเราในการพัฒนาทีวีที่สามารถจัดการกับภาษาอย่างสมบูรณ์และเป็นธรรมชาติ

lm_5_4_lc_43_1_131210

Hideaki Nakaoka
ออกแบบระบบเบราเซอร์ / ออกแบบ UI
วิศวกรซอฟต์แวร์
เข้าร่วมแผนกวิศวกรรมการผลิตขององค์กรของ Panasonic ในปี 1994
โอนไปยังแผนก R&D ขององค์กรในปี 2000 ซึ่งเขาทำการวิจัยเกี่ยวกับเบราเซอร์ การถ่ายทอดข้อมูล และ DRM สำหรับการถ่ายทอด IP
โอนย้ายสู่ส่วนการพัฒนาทีวีในปี 2007

สิ่งที่อยากบอก...
ผมคิดว่าฟังก์ชันที่สะดวกสบายที่สุดคือการสามารถค้นหาบางสิ่งบนเว็บด้วยคำสั่งเสียงจากหน้าจอหลัก มีสถานที่มากมายที่ผู้คนสามารถใช้ฟังก์ชันนี้ เนื่องจากคุณไม่จำเป็นต้องป้อนข้อความบนแป้นพิมพ์เหมือนที่ทำกับพีซี และเบราเซอร์เริ่มทำงานอย่างรวดเร็วเพื่อแสดงผลลัพธ์การค้นหา

นอกจากนี้คุณยังสามารถใช้เบราเซอร์ด้วยคำสั่งเสียงได้ด้วย ตัวอย่างเช่น หากข้อความในเบราเซอร์เล็กเกินกว่าจะอ่านได้อย่างง่ายดาย คุณสามารถพูดว่า "ขยาย"

lm_5_4_lc_43_2_131210

Makoto Sekito
การรวมรีโมทคอนโทรล ไมโครโฟน
วิศวกรฮาร์ดแวร์
เข้าร่วมแผนกทีวีปัจจุบันของ Panasonic ในปี 2002
จัดการการพัฒนา CATV STB สำหรับอเมริกาเหนือจนถึงปี 2007
หลังจากนั้นเขารับผิดชอบการพัฒนา LSI สำหรับการถ่ายทอดสัญญาณในยุคถัดไปในปี 2010

สิ่งที่อยากบอก...
ในฐานะสมาชิกทีมรีโมทคอนโทรล ผมมีเป้าหมายในการออกแบบตัวควบคุมทัชแพ็ดที่ช่วยให้ผู้ใช้ใช้ทีวีอย่างสะดวกสบาย

รีโมทคอนโทรลที่มีปุ่มมากมายยังคงเป็นกระแสหลัก แต่ผมคิดว่ารีโมทประเภทที่เรียบง่ายเช่นตัวควบคุมทัชแพ็ดของเรานั้น จะแพร่หลายมากขึ้นในอนาคต เราหวังว่าจะสามารถทำให้รีโมทคอนโทรลใช้งานได้สะดวกสบายยิ่งขึ้น

lm_5_4_lc_43_3_131210

Kazuhiro Imai
การรวมรีโมทคอนโทรล ไมโครโฟน
วิศวกรฮาร์ดแวร์
เข้าร่วมส่วนการพัฒนาทีวีปัจจุบันของ Panasonic ในปี 1998
ปัจจุบันพัฒนาฮาร์ดแวร์สำหรับตัวควบคุมทัชแพ็ด

สิ่งที่อยากบอก...
ตัวควบคุมทัชแพ็ดได้รับการออกแบบโดยการศึกษาทั้งในแง่มุมฮาร์ดแวร์และซอฟต์แวร์อย่างละเอียด จนถึงขณะนี้รีโมทคอนโทรลมีภาษาและปุ่มกดมากมายสำหรับแต่ละประเทศและภูมิภาค หมายความว่าเราผลิตรีโมทคอนโทรลมากกว่า 50 ประเภทต่อปี ตัวควบคุมทัชแพ็ดเป็นอุปกรณ์สากล ดังนั้น จึงมีเพียงประเภทเดียว ผมหวังว่าเราจะยังคงสามารถนำเสนอการออกแบบใหม่ๆ ที่ผู้คนทั่วโลกจะเพลิดเพลินได้ต่อไป