سیاست‌مداران باید داستان «علمی تخیلی» بخوانند، نه وسترن و کارآگاهی. -  آرتور سی. کلارک (Arthur C. Clarke)
این که کامپیوترها روزی مثل انسان فکر کنند خطرناک نیست، بلکه خطر در این است که بشر مثل کامپیوتر فکر کند!  -  سیدنی هریس (Sydney J. Harris)
اگر گمان می‌کنید که فناوری مشکل امنیتی شما را حل خواهد کرد، معلوم است که نه مشکل را درک کرده‌اید و نه فناوری را!   -   بروس شنییِر (Bruce Schneier)
کامپیوترهای آینده بیش از یک و نیم تن وزن نخواهند داشت.   -   مجله ماشین‌های محبوب 1949 (Popular Machines)
«ببین بابا جون. همه کلیدهای صفحه‌کلیدت رو به ترتیب حروف الفبا چیدم! بهتر نشد؟»  -  ناشناس
کامپیوترم مرا در شطرنج شکست داد، ولی در مشت و لگد حریفم نشد!  -  اوم فیلیپس
خود بشر هنوز شگفت‌انگیزترین کامیپوتر است.   -   جان اف کندی (John F. Kennedy)
یک ماشین می‌تواند کار پنجاه مرد عادی را انجام دهد، اما هیچ ماشینی نمی‌توانند کار یک مرد فوق‌العاده را انجام دهد.  -  البرت هوبارد (Elbert Hubbard)
بی‌خطا بودن ، زیستنی است بی‌معنا  ، نه جدالی، نه لذتی    -    برایان پورتر (Brian M. Porter, 1998)
تنها استفاده مشروع از کامپیوترها بازی‌های کامپیوتری است.   -   اوژن جارویس (Eugene Jarvis)

مترجم: سیامک پاپیرانی

هر چند که تصاویر حاوی گنجینه‌‌ای از اطلاعات هستند، اما طبقه‌بندی آن‌ها به صورتی که «قابل جستجو» باشند، دشوار است. محققین اروپایی در حال ایجاد و تولید ترکیبی از تکه‌های اطلاعاتی هستند که یک تصویر را «جستنی» می‌کند.

تصاویر دیجیتال می‌توانند چشمان ما را به دنیایی از زیبایی و جزئیات باز کنند. اما عامل بازدارنده‌ای در این میان وجود دارد: اطلاعات درون یک تصویر صرفا «دیدنی» است! یک عکس به ما نمی‌گوید که کی و کجا و از چه کسانی یا از چه چیزی گرفته شده است. این ما هستیم که با دیدن عکس این اطلاعات را «برداشت» می‌کنیم. این امر دسته‌بندی و جستجوی تصاویر را برای ما سخت می‌کند، خواه در یک گالری عکاسی کار کنیم، خواه مشغول به مرتب کردن آلبوم خانوادگیمان باشیم.

putting-pictures-into-wordsدانشمندان یک پروژه‌ی عظیم اروپایی به نام اِیس مدیا (AceMedia) گام‌های بزرگی در راه حل این معضل برداشته‌اند. آنان مشغول تشکیل یک لایه‌ی اطلاعاتی درون فایل‌های تصویری هستند. چشم‌اندازشان نیز این است که کاری کنند تا هر تصویر با محتوای اطلاعاتی‌ای که به فراداده موسوم بوده و در عین حال قابل استفاده در اینترنت و موتورهای جستجو است، همراه شود. مضاف بر این، یک لایه‌ی هوشمند نیز اضافه می‌شود که به صورت خودکار برای تصویر کلمات کلیدی قابل جستجو تولید می‌کند. این لایه‌ی اضافی که به صورت خودکار یا دستی قابلیت افزودن کلیدواژه به تصویر را دارد، می‌تواند در ابزارهای جستجوی به کار رفته در اینترنت، کامپیوتر شخصی یا تلفن همراه انقلابی ایجاد کند.

ساخت یک پازل تصویری

در این پروژه از مجموعه‌ای از فناوری‌هایی استفاده می‌شود که در حال حاضر در بازار موجودند، یا از ابتدا در پروژه گنجانده شده‌اند و یا ترکیبی از این دو حالت هستند. این فناوری‌ها در ساخت مجموعه‌ای غنی از اطلاعات بر اساس تصویر به کار می‌آیند. یکی از این فناوری‌های ابداعی قادر است توصیف‌گرهای بصری سطح پایین تصاویر را شناسایی کند. مثلا یک ناحیه رنگی که احتمالا آسمان، دریا، صحرا یا برف است، و یا اطلاعاتی در مورد بافت، لبه و شکل اجسام.

ترکیب این گونه اطلاعات با قواعد مفهومی‌ که در دامنه‌ی هستی‌شناسی (Ontology Domain) مد نظر است؛ داده‌ها را به منبعی غنی از اطلاعات بدل می‌کند. منظور از این قواعد هستی‌شناسی مجموعه‌ای از ابزارهای شناسایی است که می‌توانند وجود ناحیه‌ی آبی بالای یک تصویر را به عنوان آسمان برداشت کنند و یا در مقابل آن احتمال حضور صحرا یا برف را در همان تصویر بسیار پایین قلمداد کنند.به گفته‌ی یانیس کومپاتسیاریس (Yiannis Kompatsiaris)، سرپرست یونانی تیم، تبدیل این توصیف‌گرهای سطح پایین به اطلاعات کار بسیار سختی است. تیم او مسئول ساختاربندی دانش و افزودن آن به مجموعه‌ی قواعد دامنه‌ی هستی‌شناسی، بر اساس توصیف‌گرهای سطح پایین است.این مجموعه‌ی داده‌ها با داده‌هایی که از پویشگرهای خاص، از قبیل نرم‌افزارهای تشخیص چهره استخراج می‌شود، ترکیب می‌گردند. گروه دیگری از داده‌ها نیز توسط کاربران اضافه می‌شوند که نرم‌افزارها و الگوریتم‌های تولید پروفایل نیز می‌توانند بخشی از این کار را خودکار کنند. برای این که کار جستجو باز هم ساده‌تر شود، گروه اِیس مدیا الگوریتم‌های مبتنی بر زبان طبیعی را هم به کار گرفته‌اند که به کاربر امکان جستجو به وسیله‌ی زبان روزمره را می‌دهد.

چارچوب ACE

محققان اِیس مدیا تمام این فناوری‌ها را در چارچوبی تحت عنوان «موجودیت محتوای مستقل – Autonomous Content Entity و به اختصار ACE» گرد آورده‌اند. این چارچوب شامل رابط‌های برنامه نویسی (API) است تا بتواند از نرم‌افزارهای شبکه، مدیریت پایگاه داده، برنامه‌نویسی، پیش پردازش محتوا، بصری کردن محتوا، تحلیل محتوای دانش‌محور و تحلیل مفهومی و نیز ماژول‌های مدل‌سازی پشتیبانی کند و امکان برقراری ارتباط با آن‌ها را فراهم سازد. با استفاده از این رابط‌ها می‌توان برنامه‌های کاربردی متنوعی در زمینه‌ی پردازش تصاویر ایجاد کرد که ماحصلشان می‌تواند به فایل تصویر ضمیمه شود.

این تیم برای تصویر متحرک هم استاندارد aceSVC را ابداع کرده است. این استاندارد زنجیره‌ای از ماژول‌های اصلی (رمزگذار، استخراج کننده و رمزبردار) را همراه تصاویر می‌کند که قابلیت پخش، مرور و تحلیل تصاویر در محیطی فشرده را امکان‌پذیر می‌کند.این گروه برای نشان دادن امکان‌پذیری و مزایای پروژه، قابلیت‌های آن را در یک محیط آزمون متشکل از تجهیزات شبکه، کامپیوتر شخصی و تلفن همراه و حتی دستگاه‌های گیرنده‌ی دیجیتالی به نمایش گذاشتند.

افزودن زمان و مکان

به گفته یانیس، طی پنج سال آینده بسیاری از این فناوری‌ها به استفاده‌ی عموم خواهد رسید و این مجموعه با فناوری‌هایی مانند «برچسب جغرافیایی» (geo-tag) که با گیرنده‌های GPS قابل دریافت هستند، تکمیل خواهد شد. "به گمانم دوربین‌های آینده قابلیت تشخیص موقعیت جغرافیایی خود را خواهند داشت و با ترکیب این اطلاعات به محتوای تحلیلی، نتیجه‌ای به مراتب ارزنده‌تر از آن چه در پروژه‌ی حاضر مهیا شده است، تولید خواهند کرد. مثلا، اگر دوربین بداند که در یک موقعیت کوهستانی قرار دارد، اطلاعات تحلیل بسیار معتبرتری تولید و همراه عکس خواهد کرد."

شماره 00