مترجم: سیامک پاپیرانی
هر چند که تصاویر حاوی گنجینهای از اطلاعات هستند، اما طبقهبندی آنها به صورتی که «قابل جستجو» باشند، دشوار است. محققین اروپایی در حال ایجاد و تولید ترکیبی از تکههای اطلاعاتی هستند که یک تصویر را «جستنی» میکند.
تصاویر دیجیتال میتوانند چشمان ما را به دنیایی از زیبایی و جزئیات باز کنند. اما عامل بازدارندهای در این میان وجود دارد: اطلاعات درون یک تصویر صرفا «دیدنی» است! یک عکس به ما نمیگوید که کی و کجا و از چه کسانی یا از چه چیزی گرفته شده است. این ما هستیم که با دیدن عکس این اطلاعات را «برداشت» میکنیم. این امر دستهبندی و جستجوی تصاویر را برای ما سخت میکند، خواه در یک گالری عکاسی کار کنیم، خواه مشغول به مرتب کردن آلبوم خانوادگیمان باشیم.
دانشمندان یک پروژهی عظیم اروپایی به نام اِیس مدیا (AceMedia) گامهای بزرگی در راه حل این معضل برداشتهاند. آنان مشغول تشکیل یک لایهی اطلاعاتی درون فایلهای تصویری هستند. چشماندازشان نیز این است که کاری کنند تا هر تصویر با محتوای اطلاعاتیای که به فراداده موسوم بوده و در عین حال قابل استفاده در اینترنت و موتورهای جستجو است، همراه شود. مضاف بر این، یک لایهی هوشمند نیز اضافه میشود که به صورت خودکار برای تصویر کلمات کلیدی قابل جستجو تولید میکند. این لایهی اضافی که به صورت خودکار یا دستی قابلیت افزودن کلیدواژه به تصویر را دارد، میتواند در ابزارهای جستجوی به کار رفته در اینترنت، کامپیوتر شخصی یا تلفن همراه انقلابی ایجاد کند.
ساخت یک پازل تصویری
در این پروژه از مجموعهای از فناوریهایی استفاده میشود که در حال حاضر در بازار موجودند، یا از ابتدا در پروژه گنجانده شدهاند و یا ترکیبی از این دو حالت هستند. این فناوریها در ساخت مجموعهای غنی از اطلاعات بر اساس تصویر به کار میآیند. یکی از این فناوریهای ابداعی قادر است توصیفگرهای بصری سطح پایین تصاویر را شناسایی کند. مثلا یک ناحیه رنگی که احتمالا آسمان، دریا، صحرا یا برف است، و یا اطلاعاتی در مورد بافت، لبه و شکل اجسام.ترکیب این گونه اطلاعات با قواعد مفهومی که در دامنهی هستیشناسی (Ontology Domain) مد نظر است؛ دادهها را به منبعی غنی از اطلاعات بدل میکند. منظور از این قواعد هستیشناسی مجموعهای از ابزارهای شناسایی است که میتوانند وجود ناحیهی آبی بالای یک تصویر را به عنوان آسمان برداشت کنند و یا در مقابل آن احتمال حضور صحرا یا برف را در همان تصویر بسیار پایین قلمداد کنند.به گفتهی یانیس کومپاتسیاریس (Yiannis Kompatsiaris)، سرپرست یونانی تیم، تبدیل این توصیفگرهای سطح پایین به اطلاعات کار بسیار سختی است. تیم او مسئول ساختاربندی دانش و افزودن آن به مجموعهی قواعد دامنهی هستیشناسی، بر اساس توصیفگرهای سطح پایین است.این مجموعهی دادهها با دادههایی که از پویشگرهای خاص، از قبیل نرمافزارهای تشخیص چهره استخراج میشود، ترکیب میگردند. گروه دیگری از دادهها نیز توسط کاربران اضافه میشوند که نرمافزارها و الگوریتمهای تولید پروفایل نیز میتوانند بخشی از این کار را خودکار کنند. برای این که کار جستجو باز هم سادهتر شود، گروه اِیس مدیا الگوریتمهای مبتنی بر زبان طبیعی را هم به کار گرفتهاند که به کاربر امکان جستجو به وسیلهی زبان روزمره را میدهد.
چارچوب ACE
محققان اِیس مدیا تمام این فناوریها را در چارچوبی تحت عنوان «موجودیت محتوای مستقل – Autonomous Content Entity و به اختصار ACE» گرد آوردهاند. این چارچوب شامل رابطهای برنامه نویسی (API) است تا بتواند از نرمافزارهای شبکه، مدیریت پایگاه داده، برنامهنویسی، پیش پردازش محتوا، بصری کردن محتوا، تحلیل محتوای دانشمحور و تحلیل مفهومی و نیز ماژولهای مدلسازی پشتیبانی کند و امکان برقراری ارتباط با آنها را فراهم سازد. با استفاده از این رابطها میتوان برنامههای کاربردی متنوعی در زمینهی پردازش تصاویر ایجاد کرد که ماحصلشان میتواند به فایل تصویر ضمیمه شود.
این تیم برای تصویر متحرک هم استاندارد aceSVC را ابداع کرده است. این استاندارد زنجیرهای از ماژولهای اصلی (رمزگذار، استخراج کننده و رمزبردار) را همراه تصاویر میکند که قابلیت پخش، مرور و تحلیل تصاویر در محیطی فشرده را امکانپذیر میکند.این گروه برای نشان دادن امکانپذیری و مزایای پروژه، قابلیتهای آن را در یک محیط آزمون متشکل از تجهیزات شبکه، کامپیوتر شخصی و تلفن همراه و حتی دستگاههای گیرندهی دیجیتالی به نمایش گذاشتند.
افزودن زمان و مکان
به گفته یانیس، طی پنج سال آینده بسیاری از این فناوریها به استفادهی عموم خواهد رسید و این مجموعه با فناوریهایی مانند «برچسب جغرافیایی» (geo-tag) که با گیرندههای GPS قابل دریافت هستند، تکمیل خواهد شد. "به گمانم دوربینهای آینده قابلیت تشخیص موقعیت جغرافیایی خود را خواهند داشت و با ترکیب این اطلاعات به محتوای تحلیلی، نتیجهای به مراتب ارزندهتر از آن چه در پروژهی حاضر مهیا شده است، تولید خواهند کرد. مثلا، اگر دوربین بداند که در یک موقعیت کوهستانی قرار دارد، اطلاعات تحلیل بسیار معتبرتری تولید و همراه عکس خواهد کرد."
| < قبلی | بعدی > |
|---|