گوگل فناوری مدل پرتره خود را متن باز کرد
تقسیم معنایی تصویر در واقع یک تکنولوژی است که تمامی پیکسلهای موجود در یک عکس را دستهبندی و به آن یک برچسب معنادار مثل جاده، آسمان، شخص یا نام یک حیوان الحاق میکند. حالا کمپانی گوگل جدیدترین مدل تقسیم تصویر خود را منتشر کرده و مهمتر اینکه حالا این مدل به حالت متن باز درآمده است. بدین ترتیب سایر توسعه دهندگان میتوانند از این مدل در ساخت اپلیکیشنهای خود بهره بگیرند و از مزایای فناوری یادشده استفاده کنند.
میتوان به روشهای زیادی از این فناوری استفاده کرد. یکی از جدیدترین اپلیکیشنهای دنیای گوشی هوشمند، Portrait Mode است که در نسل جدید گوشیهای سری پیکسل ۲ گوگل ارائه شده است. فناوری مورد بحث در این اپلیکیشن بهمنظور کمک به جداسازی سوژههای پیشزمینهی تصویر از پسزمینه به کار گرفته میشود. همچنین میتوانید از این تکنولوژی برای بهینهسازی خودکار تنظیمات رنگ یا اکسپوژر بهره ببرید.
محلیسازی برچسبگذاری پیکسل به پیکسل نسبت به سایر فناوریهای تشخیص اشیاء در تصاویر، نیاز به دقت بالاتری دارد؛ اما فناوری گوگل به دلیل همین دقت بالاتر، نتایج باکیفیتتری به کاربران ارائه میدهد. خبر خوب این است که گوگل حالا جدیدترین مدل تکنولوژی تقسیم معنایی تصویر +DeepLab-v3 را منتشر کرده و حالا سایر توسعهدهندگان نیز میتوانند از این فناوری در ساخت اپلیکیشنهای مورد نظر خود بهره ببرند.
سیستمهای مدرن تقسیم معنایی تصویر که روی شبکههای عصبی کانولوشنی (CNNs) ساخته میشوند، به لطف بهره گرفتن از روشهای پیشرفته، سختافزارهای جدید و نیز مجموعهی دادهها به سطح بالایی از دقت دست یافتهاند که دستیابی به چنین سطحی تا پنج سال قبل حتی قابل تصور هم نبود. عمومیسازی این سیستم و اشتراکگذاری آن با جوامع کاربری، دسترسی سایر گروههای دانشگاهی و صنعتی را به این فناوری آسانتر خواهد کرد که در نتیجه منجر به تولید و پیشرفت بیشتر بر پایهی سیستمهای پیشرفته خواهد شد که از جمله میتوان به ایجاد مجموعه دادههای جدید و تولید اپلیکیشنهای جدید برای این تکنولوژی اشاره کرد.
اگر تمایل دارید جزئیات بیشتری در مورد +DeepLab-V3 بهدست آورید، پیشنهاد میکنیم سری به وبلاگ تحقیقاتی گوگل بزنید.
برگرفته از DPREVIEW