Adobe ต้องการให้คุณแก้ไขรูปภาพด้วยเสียงด้วยผู้ช่วยสไตล์ Siri
รูปภาพ: Adobe Research/YouTube
ช่างภาพที่ยอดเยี่ยมมักเป็นผู้ช่วยที่ดี Ansel Adams จ้างช่างเทคนิคห้องมืดที่พิมพ์ตามข้อกำหนดที่แน่นอนของเขาและความเขียวชอุ่ม การจัดแสงในภาพเหมือนของ Annie Leibovitz มักทำได้โดยผู้ช่วยที่ไว้ใจได้ซึ่งเข้าใจเธอ วิสัยทัศน์.
Adobe กำลังทำงานเพื่อให้ช่างภาพทุกระดับเป็นผู้ช่วยที่มีค่า และเสียงของผู้ช่วยนั้นอาจฟังดูคุ้นเคย
วิดีโอที่ผลิตโดย Adobe Research แสดงให้เห็นชายคนหนึ่งสั่งเสียงให้ iPad เพื่อครอบตัดรูปภาพและเตรียมโพสต์บน Facebook เสียงที่มาจาก iPad ฟังดูเหมือน Siri เมื่อทำซ้ำคำสั่งของช่างภาพ
วิดีโอความยาว 40 วินาทีนี้แสดงคำสั่งเสียงเพียงไม่กี่คำสั่งที่ทริกเกอร์สิ่งที่ดูเหมือนเป็นเครื่องมือแก้ไขพื้นฐานของกล้องในเครื่องของอุปกรณ์ แต่วิดีโอดังกล่าวนำเสนอภาพอนาคตหลังการถ่ายทำที่ไม่ต้องใช้เมาส์ แทร็คแพด หรือการกดแป้นพิมพ์
วิดีโอถูกโพสต์ไปยัง YouTube โดย Adobe Research ในวันอังคารและจะทำรอบในเว็บไซต์การถ่ายภาพเช่น iso1200 และ PetaPixelซึ่งเป็นหนึ่งในคนกลุ่มแรกๆ ที่รายงานเกี่ยวกับความคิดริเริ่มใหม่
Adobe Research "กำลังสำรวจว่าการแก้ไขภาพผู้ช่วยดิจิทัลอัจฉริยะอาจมีหน้าตาเป็นอย่างไร" ทีมวิจัยเขียนไว้ในวิดีโอแนะนำ YouTube เราผสมผสานศาสตร์แห่งการโต้ตอบด้วยเสียงเข้ากับความเข้าใจอย่างลึกซึ้งของทั้งเวิร์กโฟลว์ที่สร้างสรรค์และแรงบันดาลใจที่สร้างสรรค์ของลูกค้าของเรา
“ระบบการรู้จำคำพูดของเราสามารถยอมรับคำสั่งเสียงของผู้ใช้ตามธรรมชาติสำหรับรูปภาพได้โดยตรง แก้ไขภายในเครื่องผ่านคอมพิวเตอร์ในอุปกรณ์หรือผ่านความเข้าใจภาษาธรรมชาติบนคลาวด์ บริการ. นี่เป็นก้าวแรกสู่อินเทอร์เฟซเสียงแบบต่อเนื่องหลายรูปแบบซึ่งช่วยให้ลูกค้าที่สร้างสรรค์ของเราค้นหาและแก้ไขภาพได้อย่างง่ายดายและมีส่วนร่วม”
แม้ว่าอินเทอร์เฟซเสียงจะเจ๋ง แต่ฉันก็รู้สึกทึ่งกับวลีนี้: ความเข้าใจอย่างลึกซึ้งเกี่ยวกับขั้นตอนการทำงานที่สร้างสรรค์และแรงบันดาลใจที่สร้างสรรค์
การปรับสีภาพถ่ายใน Photoshop อาจเป็นกระบวนการที่ละเอียด แม่นยำ และใช้เวลานาน ผลลัพธ์สุดท้ายของการปรับแต่งทีละขั้นเป็นเรื่องส่วนตัวและขึ้นอยู่กับรสนิยมของช่างภาพแต่ละคน ผู้ใช้สามารถใช้ภาษาได้สบายเพียงใดนั้นไม่ชัดเจนจากวิดีโอของ Adobe แต่มีแนวโน้มว่าคำสั่งเสียงควรจะเป็น สำหรับโปรแกรมที่ซับซ้อน เช่น Photoshop ผู้ใช้จะต้องใช้คำบางคำสำหรับเครื่องมือ การตั้งค่า และ การกระทำ
แต่สามารถใช้คำสั่งเสียงเพื่อข้ามขั้นตอนทางเทคนิคทั้งหมดได้หรือไม่
ในปี 2014 Adobe และ MIT ได้ทำการวิจัยสาธารณะเกี่ยวกับอาคารที่ซับซ้อน อัลกอริธึมตามสไตล์ลายเซ็นของช่างภาพที่มีชื่อเสียงต่างๆ. คุณอาจไม่มีเงินจ้าง Martin Schoeller เพื่อยิงแก้ว LinkedIn ของคุณ แต่คุณสามารถถ่ายเซลฟี่และกดที่ตั้งไว้ล่วงหน้าเพื่อนำลุคของเขามาสู่ภาพถ่ายที่ดูน่าเบื่อของคุณ
ลองนึกภาพคำสั่งเสียงเดียวสำหรับรูปภาพที่คุณสร้างที่โยเซมิตีในช่วงฤดูร้อนซึ่งมีลักษณะเช่น "ทำให้ดูเหมือนพิมพ์ Ansel Adams"
แหล่งที่มา: PetaPixel