Anonim

API การจดจำรูปภาพคืออะไรและพวกเขาสามารถทำอะไรให้คุณ บทความนี้จะอธิบายถึงการรับรู้ภาพว่า API ทำอะไรและจะช่วยให้คุณหรือธุรกิจของคุณได้รับประโยชน์จากอินเทอร์เน็ตมากขึ้นได้อย่างไร การรับรู้ภาพมีศักยภาพมากสำหรับธุรกิจและสำหรับผู้ใช้อินเทอร์เน็ตที่มีความบกพร่องทางสายตา

API การจดจำรูปภาพคืออะไร

การจดจำรูปภาพคือส่วนที่ซอฟต์แวร์ตรวจพบลักษณะของภาพและจัดหมวดหมู่ได้อย่างถูกต้อง ตัวอย่างเช่นหากคุณอัปโหลดรูปภาพของ Ferrari 458 ไปยัง API การจดจำรูปภาพคุณควรทราบว่าเป็นรถยนต์และเป็นสีแดง (หรือควรเป็น) ขึ้นอยู่กับ API การจำแนกประเภทอาจทำได้ขึ้นอยู่กับประเภทของภาพที่คุณใช้

นี่อาจดูง่ายจริง ๆ - มนุษย์สามารถดูรูปภาพและบอกคุณว่ามันเป็นภาพของอะไรโดยไม่ต้องพยายามส่วนใหญ่ - แต่นี่เป็นปัญหาที่ยากมากในการสอนคอมพิวเตอร์ให้แก้ปัญหา งานจำนวนมากได้ค้นพบว่าคอมพิวเตอร์สามารถเข้าใจในสิ่งที่มีลักษณะอย่างไรและเราได้ก้าวไปอย่างมากจากความสามารถในการค้นหาภาพย้อนกลับไปยังเครือข่าย Deep Dream ที่มีชื่อเสียงของ Google

API คือส่วนต่อประสานโปรแกรมประยุกต์ มันเป็นคนกลางโดยพื้นฐานระหว่างรูทีนโปรแกรมที่บอกองค์ประกอบหนึ่งว่าจะทำงานร่วมกับองค์ประกอบอื่นได้อย่างไรหรือจัดเตรียมเครื่องมือที่จำเป็นในการปฏิบัติหน้าที่ มี API หลายประเภทที่สามารถบรรลุเป้าหมายได้ทุกประเภทโดยใช้ภาษาการเขียนโปรแกรมที่หลากหลาย ในบริบทนี้ API การจดจำรูปภาพเป็นเครื่องมือที่คุณสามารถใช้เพื่อเข้าถึงพลังการเรียนรู้อย่างลึกซึ้งของระบบรู้จำภาพเชิงพาณิชย์บางระบบ

คุณต้องใช้พลังในการคำนวณจำนวนมากเพื่อทำการจดจำรูปภาพ คุณต้องการข้อมูลจำนวนมากและพลังในการตีความทุกอย่าง ผู้ใช้ส่วนใหญ่ไม่มีทรัพยากรขนาดใหญ่เพื่อสร้างเครื่องการเรียนรู้อย่างล้ำลึกของตนเอง ชื่อใหญ่ ๆ เช่น Vision API ของ Google, Face API ของ Microsoft, ImageNet และอื่น ๆ มีเครื่องดังกล่าวและอนุญาตให้เข้าถึงพวกเขาผ่านทาง API ได้โดยไม่เสียค่าใช้จ่ายหรือเสียค่าธรรมเนียม สิ่งนี้ช่วยให้ธุรกิจทุกขนาดเข้าถึงพลังนี้และผู้ใช้ได้รับประสบการณ์ใหม่ ๆ

การรู้จำภาพจะเปลี่ยนประสบการณ์อินเทอร์เน็ตของเราอย่างไร

ผู้ใช้อินเทอร์เน็ตที่แตกต่างกันจะได้รับข้อดีต่าง ๆ จากการจดจำรูปภาพ ลองดูที่เจ้าของเว็บไซต์สมมุติและผู้ใช้สมมุติเพื่อดูว่าทั้งสองฝ่ายมีประโยชน์อย่างไร

ประโยชน์ทางธุรกิจของการจดจำภาพ

ตัวอย่างเช่นสมมติว่าคุณใช้พอร์ทัลขายตัวเองคล้ายกับ Etsy หรือเว็บไซต์หาคู่ คุณต้องการจัดการคุณภาพและความเหมาะสมของภาพทั้งหมดที่อัพโหลดโดยผู้ใช้ คุณต้องการบล็อกภาพสำหรับผู้ใหญ่หรือภาพที่ไม่เหมาะสมทั้งหมดและจัดเรียงเป็นหมวดหมู่ที่เหมาะสม แต่คุณไม่สามารถทำได้ด้วยมือ

ป้อน API การจดจำรูปภาพ คุณสามารถใช้ API พร้อมกับเครื่องจดจำภาพที่เหมาะสมเพื่อสแกนภาพทุกภาพและกำหนดตามเกณฑ์ที่ตั้งไว้ ดังนั้นคุณสามารถสแกนคลังภาพเพื่อหารูปภาพที่ไม่เหมาะสมและลบออก คุณสามารถสแกนภาพและเรียงลำดับที่มีอาหารเป็นหมวดหมู่ "อาหาร" และเสื้อถักลงในหมวดหมู่ "ทำด้วยผ้าขนสัตว์" เมื่อคุณบอก API ว่าต้องทำอย่างไรกระบวนการจะเป็นไปโดยอัตโนมัติ

นอกจากนี้ยังมีโอกาสสำหรับความเป็นจริงยิ่งและภาพและวิดีโอแบบโต้ตอบ คุณสามารถใช้การรับรู้ภาพเพื่อให้โปรแกรมรับรู้วัตถุในโลกแห่งความจริง ตัวอย่างเช่นคุณสามารถถ่ายรูปคู่ของรองเท้าผ้าใบที่มีคนสวมอยู่ข้างถนน หากโปรแกรมรับรู้รองเท้าผ้าใบรูปภาพก็สามารถเพิ่มพร้อมลิงค์เพื่อซื้อด้วยตัวคุณเอง ธุรกิจนี้เป็นประโยชน์ (มีโอกาสขายทันที) และเป็นประโยชน์ต่อผู้ใช้ (พวกเขาได้รับสิ่งที่พวกเขาต้องการในตอนนี้)

ผู้ใช้ประโยชน์ของการรับรู้ภาพ

ตัวอย่างรองเท้าผ้าใบด้านบนเป็นเพียงวิธีหนึ่งที่ผู้ใช้จะได้รับประโยชน์จากการจดจำรูปภาพ เพิ่มความเป็นจริงหมายความว่าเราสามารถเข้าถึงความเห็นข้อมูลราคาและข้อมูลจำนวนมากได้อย่างง่ายดายเพียงแค่ถ่ายภาพผลิตภัณฑ์ ที่ให้ข้อมูลจำนวนมหาศาลแก่ผู้ใช้เพื่อช่วยในการตัดสินใจซื้อ

Mark Zuckerberg สรุปผลประโยชน์ที่มักจะมองข้ามในการจดจำภาพในคำพูดของเขาเกี่ยวกับ AI เมื่อต้นปีนี้ เขาจินตนาการถึง API การจดจำรูปภาพที่ทำงานกับคนตาบอดหรือผู้ที่มองเห็นเพียงบางส่วนที่สามารถ“ อ่าน” รูปภาพและอธิบายสิ่งที่เห็นออกมาดัง ๆ สิ่งนี้อาจมีผลกระทบอย่างมากสำหรับผู้ใช้อินเทอร์เน็ตที่บกพร่องหรือด้วยความเป็นจริงที่เพิ่มขึ้นในโลกแห่งความเป็นจริงในบางครั้ง

การจดจำรูปภาพยังเป็นส่วนหนึ่งในความปลอดภัยของยานพาหนะ เทคโนโลยีใหม่ในการเบรกและการหลีกเลี่ยงการชนกันอย่างอิสระที่ถูกนำมาใช้นั้นคล้ายกับ API ที่เรากำลังพูดถึง พวกเขาสแกนและประเมินภาพหลายครั้งต่อวินาทีเพื่อให้คุณและรถปลอดภัยขณะอยู่บนท้องถนน เทคโนโลยีนี้ที่บอกรถยนต์ของตนเองว่ามีอะไรรอบตัวบ้างเช่นกัน

API การจดจำรูปภาพจะไม่ปฏิวัติประสบการณ์อินเทอร์เน็ตของเราด้วยตัวเอง พวกเขาทำงานร่วมกับเทคโนโลยีที่มีอยู่เพื่อเพิ่มชั้นของการมีปฏิสัมพันธ์และการดื่มด่ำกับโลกที่เราเห็น ในขณะที่ตัวอย่างของบทความนี้มี จำกัด แต่มีศักยภาพอย่างมากสำหรับการเล่นเกมภาพยนตร์อุตสาหกรรมยานยนต์ค้าปลีกความบันเทิงและอุตสาหกรรมใด ๆ ที่เปิดใช้งานเทคโนโลยี นี่เป็นเพียงจุดเริ่มต้นของสิ่งที่ระบบอัจฉริยะสามารถบรรลุได้!

Apis การจดจำรูปภาพคืออะไรและพวกเขาทำอะไรให้คุณได้บ้าง