سرویس گوگل Photos به تازگی الگورتیمی را به کار گرفته که میتواند مواردی مانند چهره سگ، گربه، انسان، تصویر غذا و … را شناسایی کند. اما این تمام آن چیزی نیست که گوگل به دنبال آن است. این غول دنیای فناوری مدتی است که در حال کار بر روی قابلیتهای تشخیص تصویر پیشرفتهتری است و سرانجام امروز میزان پیشرفت خود را با توسعه دهندگان در میان گذاشت.
تصویر زیر میزان پیشرفت این سرویس را از سال ۲۰۱۴ تا به حال نشان میدهد. در واقع این سیستم در بخش تشخیص اشیا تغییر خاصی نداشته، اما در توصیف مشخصات، رنگها و حرکات میتوان بهبودهایی را در آن دید.
چیزی که مدل Inception V3 را کاربردی میکند این است که نه تنها توانایی تشخیص افراد و اشیا حاضر در تصویر را به صورت جداگانه دارد، بلکه آنها را به هم وابسته میکند. کریس شالو، از مهندسین نرم افزار تیم گوگل Brain درباره این سرویس این گونه توضیح میدهد:
به طور مثال، یک مدل دسته بندی تصاویر به شما خواهد گفت که سگ، چمن و فریزبی در تصویر دیده میشوند، ولی یک توصیف طبیعی باید علاوه بر آن به شما بگویید که رنگ چمنها چیست و چگونه سگ و فریزبی به هم مرتبط میشوند.
این نتایج با استفاده از جمع آوری توصیف انسانها از هزاران هزار تصویر و سپس انتقال این دادهها به یک تانسور فلاو به دست آمدهاند. اگر تصاویر به اندازه کافی شباهت داشته و یکسان باشند، این الگوریتم مجددا از توصیفات انسانها استفاده خواهد کرد، اما اگر چیز جدیدی در تصویر باشد خودش هم به طور جداگانه به توصیف عکس میپردازد.
مطالب مرتبط
سامسونگ دیسپلی، همچنان برترین فروشنده ی نمایشگر گوشی های هوشمند
نوکیا مدیرعامل پیشین سامسونگ الکترونیکس آمریکا را استخدام کرد
حتی خالقان آیفون هم نگران وابستگی انسان ها به تکنولوژی هستند