โครงข่ายประสาทเทียมที่น่าทึ่งของ Google จะบอกคุณว่ารูปภาพถูกถ่ายที่ไหน

โครงข่ายประสาท PlaNet

โครงข่ายประสาทเทียมของ Google ยังคงสร้างความตื่นตาตื่นใจ ด้วยเครื่องเรียนรู้เชิงลึกใหม่ที่เรียกว่า PlaNet ซึ่งได้รับการฝึกอบรมจาก 126 ล้านภาพและ ประกอบกับข้อมูล EXIF ​​​​ได้รับความสามารถ "เหนือมนุษย์" เพื่อระบุตำแหน่งของเกือบทุกอย่าง รูปถ่าย.

ทีมงานที่นำโดย Tobias Weyand ผู้เชี่ยวชาญด้านคอมพิวเตอร์วิทัศน์ของ Google ได้สร้าง PlaNet โดยการถ่ายภาพเหล่านั้นทั้งหมดแล้วใช้เพื่อแบ่งโลกออกเป็นตารางที่มีพื้นที่มากกว่า 26,000 สี่เหลี่ยม ขนาดของสี่เหลี่ยมจัตุรัสเหล่านั้นแตกต่างกันไปขึ้นอยู่กับจำนวนภาพที่เชื่อมโยงกับแต่ละสถานที่

ตัวอย่างเช่น เมืองใหญ่อย่างนิวยอร์กซิตี้ ซึ่งภาพถ่ายจำนวนมากถูกถ่ายทุกวัน มี “โครงสร้างตารางที่ละเอียดกว่าพื้นที่ห่างไกลที่มีรูปถ่ายน้อยกว่าปกติ” อธิบาย การตรวจสอบเทคโนโลยี MIT Google ละเลยมหาสมุทรและบริเวณขั้วโลก

ทีมงานใช้รูปภาพ 91 ล้านภาพเพื่อสอน PlaNet ให้หาตำแหน่งกริดโดยใช้เพียงรูปภาพเท่านั้น ผลลัพธ์ที่ได้คือเครื่องที่สามารถระบุตำแหน่งหรือตำแหน่งที่เป็นไปได้เมื่อมีการป้อนภาพถ่าย

ทีมทดสอบ PlaNet โดยใช้รูปภาพที่ติดแท็กตำแหน่ง 2.3 ล้านภาพจาก Flickr Weyand กล่าวว่าสามารถระบุตำแหน่งได้ 3.6 เปอร์เซ็นต์ด้วย "ความแม่นยำระดับถนน" และอีก 10.1 เปอร์เซ็นต์ที่ระดับเมือง PlaNet สามารถกำหนดประเทศต้นทางได้ 28.4 ภาพและเนื้อหา 48 เปอร์เซ็นต์

จากนั้น PlaNet ถูกนำไปทดสอบกับมนุษย์ ซึ่งมีความสามารถในการระบุตำแหน่งภาพโดยใช้สัญญาณบ่งชี้ทุกประเภท รวมถึงป้ายถนน รูปแบบสถาปัตยกรรม และแม้แต่ชนิดของพืชพรรณ

“Weyand และเพื่อนร่วมงานได้ทดสอบ PlaNet กับมนุษย์ 10 คนที่เดินทางอย่างดี” กล่าวเสริม เอ็มไอที “สำหรับการทดสอบ พวกเขาใช้เกมออนไลน์ที่นำเสนอผู้เล่นด้วยมุมมองแบบสุ่มที่นำมาจาก Google Street View และขอให้เขาหรือเธอระบุตำแหน่งบนแผนที่โลก”

PlaNet สามารถเอาชนะผู้เล่นที่เป็นมนุษย์ได้โดยชนะ 28 จาก 50 รอบโดยมีข้อผิดพลาดการแปลค่ามัธยฐาน 1131.7 กม. ในขณะที่ข้อผิดพลาดในการระบุตำแหน่งของมนุษย์เฉลี่ยอยู่ที่ 2320.75 กม.

“การทดลองขนาดเล็ก [นี้] แสดงให้เห็นว่า PlaNet มีประสิทธิภาพเหนือมนุษย์ในการกำหนดตำแหน่งทางภูมิศาสตร์ของฉาก Street View” ทีมงานของ Weyand กล่าว

“เราคิดว่า PlaNet มีข้อได้เปรียบเหนือมนุษย์เพราะได้เห็นสถานที่ต่างๆ มากมายเกินกว่าที่มนุษย์จะเคยไปเยี่ยมชมได้ และได้เรียนรู้เบาะแสอันละเอียดอ่อนของฉากต่างๆ ที่แม้แต่มนุษย์ที่เดินทางมาอย่างดีก็ยังแยกแยะได้ยาก” พวกเขา เพิ่ม.

PlaNet ยังสามารถระบุตำแหน่งภาพที่ถ่ายในอาคารโดยใช้ภาพถ่ายที่คล้ายกันซึ่งเชื่อมโยงกับอัลบั้มที่มีข้อมูลตำแหน่งแนบอยู่ สิ่งที่น่าประทับใจที่สุดเกี่ยวกับตัวเครื่องคือต้องการพื้นที่เพียง 377MB ซึ่งหมายความว่าจะพอดีกับสมาร์ทโฟนหรือแท็บเล็ตของคุณ

โพสต์บล็อกล่าสุด

| ลัทธิ Mac
September 11, 2021

ทุกครั้งที่ฉันคิดว่าฉันเจอหูฟังเกมมิ่งคู่โปรดแล้ว Steelseries จะส่งหูฟังมาให้ฉันลองอีกครั้งH ชุดหูฟังเกมมิ่งไร้สาย โดย Steelseriesหมวดหมู่: หูฟังทำ...

| ลัทธิ Mac
September 11, 2021

Apple Music กำลังจะได้รับการอัปเกรดครั้งใหญ่บน Androidการอัปเดตครั้งสำคัญครั้งต่อไปในเวอร์ชันเบต้าเผยให้เห็นว่าการรองรับ Android Auto กำลังมา นอกจา...

| ลัทธิ Mac
September 11, 2021

Twitter ลดตามขีดจำกัดเพื่อปราบปรามสแปมTwitter ทำให้ชีวิตของผู้ส่งอีเมลขยะยากขึ้นภาพถ่าย: TwitterTwitter ได้ลดขีดจำกัดจำนวนคนที่คุณสามารถติดตามได้ใน...