گوگل فناوری مدل پرتره خود را متن باز کرد

گوگل فناوری مدل پرتره خود را متن باز کرد

تقسیم معنایی تصویر در واقع یک تکنولوژی است که تمامی پیکسل‌های موجود در یک عکس را دسته‌بندی و به آن یک برچسب معنادار مثل جاده، آسمان، شخص یا نام یک حیوان الحاق می‌کند. حالا کمپانی گوگل جدیدترین مدل تقسیم تصویر خود را منتشر کرده و مهم‌تر اینکه حالا این مدل به حالت متن باز درآمده است. بدین ترتیب سایر توسعه دهندگان می‌توانند از این مدل در ساخت اپلیکیشن‌های خود بهره بگیرند و از مزایای فناوری یادشده استفاده کنند.

می‌توان به روش‌های زیادی از این فناوری استفاده کرد. یکی از جدیدترین اپلیکیشن‌های دنیای گوشی‌ هوشمند، Portrait Mode است که در نسل جدید گوشی‌های سری پیکسل ۲ گوگل ارائه شده است. فناوری مورد بحث در این اپلیکیشن به‌منظور کمک به جداسازی سوژه‌های پیش‌زمینه‌ی تصویر از پس‌زمینه به‌ کار گرفته می‌شود. همچنین می‌توانید از این تکنولوژی برای بهینه‌سازی خودکار تنظیمات رنگ یا اکسپوژر بهره ببرید.

محلی‌سازی برچسب‌گذاری پیکسل‌ به‌ پیکسل نسبت به سایر فناوری‌های تشخیص اشیاء در تصاویر، نیاز به دقت بالاتری دارد؛ اما فناوری گوگل به دلیل همین دقت بالاتر، نتایج باکیفیت‌تری به کاربران ارائه می‌دهد. خبر خوب این است که گوگل حالا جدیدترین مدل تکنولوژی تقسیم معنایی تصویر +DeepLab-v3 را منتشر کرده و حالا سایر توسعه‌دهندگان نیز می‌توانند از این فناوری در ساخت اپلیکیشن‌های مورد نظر خود بهره ببرند.

سیستم‌های مدرن تقسیم معنایی تصویر که روی شبکه‌های عصبی کانولوشنی (CNNs) ساخته می‌شوند، به لطف بهره گرفتن از روش‌های پیشرفته، سخت‌افزارهای جدید و نیز مجموعه‌ی داده‌ها به سطح بالایی از دقت دست یافته‌اند که دستیابی به چنین سطحی تا پنج سال قبل حتی قابل تصور هم نبود. عمومی‌سازی این سیستم و اشتراک‌گذاری آن با جوامع کاربری، دسترسی سایر گروه‌های دانشگاهی و صنعتی را به این فناوری آسان‌تر خواهد کرد که در نتیجه منجر به تولید و پیشرفت بیشتر بر پایه‌ی سیستم‌های پیشرفته خواهد شد که از جمله می‌توان به ایجاد مجموعه‌ داده‌های جدید و تولید اپلیکیشن‌های جدید برای این تکنولوژی اشاره کرد.