جهت ورود به تالار گفتمان سایت کلیک کنید


سامانه Show and Tell گوگل

اینکه کامپیوتر بتواند تصاویر را با زبانی مشابه زبان محاوره‌ای توصیف کند، هدف بزرگی است که کاربردهای زیادی دارد؛ از کمک به نابینایان تا کاربردهای امنیتی.
«Show and Tell» سامانه‌ای مبتنی بر یادگیری ماشینی است که گوگل آن را توسعه داده است و می‌تواند به طور خودکار شرحی برای عکس‌ها ارائه کند و در حال حاضر به صورت منبع‌باز ارائه شده است. نسخه جدید این سامانه در مقایسه با نسخه‌های پیشین، دقیق‌تر و فرایند آموزش آن نیز سریع‌تر است. Show and Tell برای استفاده با فریم‌ورک یادگیری ماشینی گوگل (TensorFlow) در دسترس است.

سامانه Show and Tell گوگل

کد به‌کاررفته شامل مدلی بهبودیافته برای بینایی ماشینی است که به سامانه اجازه می‌دهد سوژه‌های مختلفی را در عکس‌ها تشخیص دهد و بر اساس آن بهترین توصیفات را ارائه کند و طوری طراحی شده است که علاوه بر توصیف سوژه‌ها، جزئیاتی نظیر رنگ آن‌ها را نیز توصیف می‌کند. یکی از کاربردهایی که محققان گوگل برای چنین سامانه‌ای در نظر گرفته‌اند، استفاده از آن برای کمک به افرادی است که مشکل بینایی دارند و می‌خواهند صفحات وب را ببینند. فیسبوک نیز روی استفاده از روش‌های بینایی کامپیوتری به‌منظور توصیف تصاویر برای افراد نابینا کار می‌کند.

شرح عکس :
سمت چپ: توصیفاتی که برای هر عکس به طور دستی و به‌منظور آموزش سامانه وارد شده است.
سمت راست: شرحی که سامانه آموزش‌دیده، بدون دخالت انسان و به صورت خودکار پیشنهاد داده است.

منبع شبکه

جهت تبادل گفتگو و حل مشکلات در باره این موضوع , کلیک کنید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *