سامانه Show and Tell گوگل
اینکه کامپیوتر بتواند تصاویر را با زبانی مشابه زبان محاورهای توصیف کند، هدف بزرگی است که کاربردهای زیادی دارد؛ از کمک به نابینایان تا کاربردهای امنیتی.
«Show and Tell» سامانهای مبتنی بر یادگیری ماشینی است که گوگل آن را توسعه داده است و میتواند به طور خودکار شرحی برای عکسها ارائه کند و در حال حاضر به صورت منبعباز ارائه شده است. نسخه جدید این سامانه در مقایسه با نسخههای پیشین، دقیقتر و فرایند آموزش آن نیز سریعتر است. Show and Tell برای استفاده با فریمورک یادگیری ماشینی گوگل (TensorFlow) در دسترس است.
کد بهکاررفته شامل مدلی بهبودیافته برای بینایی ماشینی است که به سامانه اجازه میدهد سوژههای مختلفی را در عکسها تشخیص دهد و بر اساس آن بهترین توصیفات را ارائه کند و طوری طراحی شده است که علاوه بر توصیف سوژهها، جزئیاتی نظیر رنگ آنها را نیز توصیف میکند. یکی از کاربردهایی که محققان گوگل برای چنین سامانهای در نظر گرفتهاند، استفاده از آن برای کمک به افرادی است که مشکل بینایی دارند و میخواهند صفحات وب را ببینند. فیسبوک نیز روی استفاده از روشهای بینایی کامپیوتری بهمنظور توصیف تصاویر برای افراد نابینا کار میکند.
شرح عکس :
سمت چپ: توصیفاتی که برای هر عکس به طور دستی و بهمنظور آموزش سامانه وارد شده است.
سمت راست: شرحی که سامانه آموزشدیده، بدون دخالت انسان و به صورت خودکار پیشنهاد داده است.
منبع شبکه