برای مشاهده ادامه خبر به ادامه مطلب مراجعه کنید
در پاسخ به پرسش «ملخها چه میخورند؟» واتسون پاسخ داد: «کوشر». واتسون، یکی از بزرگترین ماشینهایی که انسان تاکنون ساخته، با وجود همه دادههایی که میتوانست در کسری از ثانیه به آنها دسترسی پیدا کند، بد جوری خنگ جلوه کرد.
Gonz
با
این حال، کامپیوترها توانستهاند گاهی با تقلب کردن به پیروزیهای نادری
برسند. در سال 1989 یک متخصص علوم کامپیوتر به نام مارک هامفریس (Mark
Humphrys) یک چتبات بسیار ابتدایی به نام MGonz نوشت که نهتنها کاربر
دیگر (در دانشگاه دریک، که توسط یک چتروم ابتدایی آنلاین به آن دسترسی
مییافت) را متقاعد میکرد که یک انسان است، بلکه او را با سرزنش، وادار به
اعتراف هم میکرد:
mgonz: آخرین باری که سیگار کشیدی کِی بود؟
کاربری در دریک: دیروز.
mgonz: خوب، راستش را بگو، آخرین باری که لب به سیگار زدی کِی بود؟
کاربری در دریک: گفتم که دیروز بود.
mgonz: اصلاً معلوم است که آدم بی سر و پایی هستی.
mgonz: خوب، راستش را بگو، آخرین باری که لب به سیگار زدی کِی بود؟
کاربری در دریک: خیلی خوب، باشد. 24 ساعت پیش بود. انگار خودت 20 سالی میشود که طرفش نرفتهای.
MGonz
هیچ درکی از آنچه که طرف مقابلش میگفت، نداشت، اما چنان که Humphrys
میگوید، از راه «بیاحترامی، پرخاشگری بیرحمانه، جستارهای هرزه درباره
کاربر و ایجاب ضمنی دروغگو بودن کاربر» موفق میشد.
زبان
با
هر چیزی پیچیدهتر از بلوکهای قرمز (یا بیاحترامی و بدرفتاری) به مشکل
بیان منطقی زبان برمیخوردید. مسئله دو سطح داشت: نخست نرمافزاری باید
میتوانست ابهام ذاتی درون دستور زبان و معناشناسی یک جمله را حل و فصل
کند. جمله سادهای مانند «اگر تو بیایی، به فروشگاه میروم» را در نظر
بگیرید. برای یک پارسیزبان، این جمله بیابهام است. معنیاش میشود «تنها
در صورتی که با من (و همزمان با من) بیایی، من به فروشگاه خواهمرفت.» اما
برای کامپیوتر شاید گیجکننده باشد: «یعنی چه که به فروشگاه میروم؟ (چند
بار؟ و به کدام فروشگاه؟) اگر تو، به طور کلی (یا به طور معمول) به فروشگاه
بروی، یا همین اکنون با من به فروشگاه بروی؟» بخشی از این مشکل به واژه
«اگر» بازمیگردد که در شرایط مختلف میتواند به شکلهای متفاوتی
محدودکننده منظور باشد و بخشی نیز به مفهوم «فروشگاه» مربوط است. اما
واژههای بسیاری مانند «اگر» وجود دارد و نیز مفهومهای بسیاری همچون
«فروشگاه» و شرایط بسیاری با ابهام بسیار بیشتر: ارجاعهای غیرقطعی،
بسترهای مبهم مفهومی و اصطلاحهای نامأنوس. منطق نمادی نمیتواند چنان
گنگیهایی را بپذیرد: این مفاهیم باید در ترجمه از زبان به منطق، به شکل
صریح بیان شوند و کامپیوترها نمیتوانند بهتنهایی قانونهای بغرنج، ساختگی
و غیرمنطقی فرآیند ترجمه را دریابند.
دوم این که نرمافزاری که به کار
تحلیل زبان طبیعی میپردازد، باید بتواند بفهمد آن جمله چه وضعیتی را به
جهان نشان میدهد، یا به بیان سادهتر، معنی جمله را بفهمد. و این مشکل
بزرگتر را آشکار میکند: رابطه زبان با جهان چیست؟ مردم در زندگی روزمره
همواره با این مسئله بازی میکنند: برای کسی چندان مهم نیست که یک مرد
دقیقاً چه قدر مو باید ازدست دهد تا طاس خوانده شود. اگر طاس به نظر برسد،
طاس است. حتی در سیستم قضایی هم اگر نیازی رخ دهد، تنها میتواند پریشانی
زبانشناختی را به شکلی موردی سامان دهد. اما جایی که واقعیت باید بدون
گنگی (یا دشوارتر از آن، با گنگی دقیقاً مشخصی) در قالب زبان بیان شود،
گرفتار آشفتهترین بخشهای مسئله میشویم.
فیلسوفان از پایان قرن نوزدهم
به این سو با این مسئله درگیر شدهاند. گاتلوب فرگه، برتراند راسل و
پوزیتیویستهای منطقگرا (که عقیده داشتند زبان را میتوان به بیان منطقی
درآورد) در این زمینه پیشرو بودهاند، تا آن که در دهه 1940 یکی از
هواداران پیشینشان (ویتگنشتاین) آنها را به ورطه فراموشی کشاند و W. V.
O. Quine در دهه 1950 مغلوبشان کرد. اما هواداران نخستین آنچه که بعدها
با عنوان «هوش مصنوعی معناگرا» شناخته شد، بسیار متأثر از کارهای
پوزیتیویستهای منطقگرا بودند و دههها زمان را صرف کوشش برای نوشتن
برنامههایی کردند (و میکنند) که به کامپیوترها ابزار درک زبان را بدهد.
به استثنای چند وقفه کوتاه، هوش مصنوعی به حرکت خود (مستقل از این گرایش)
ادامه دادهاست.
گوگل
در
همین هنگام، راههایی برای دور زدن مسئله درک کردن ماشینی زبان انسان پیدا
شد. در میانه دهه 1990 شماری از پژوهشگران – از جمله مشهورترینشان، دو
دانشجوی تحصیلات عالی در استنفورد با نامهای سرگئی برین و لری پیج – در
تلاش بودند با رتبهبندی کردن یافتههای جستوجوی وب براساس اهمیت آنها،
نتیجه جستوجو را بهبود بخشند. آنان دریافتند که کامپیوترها میتوانند با
بررسی توپولوژی وب (این که کدام صفحه به کدام صفحههای دیگر لینک دارد)
بدون داشتن هیچ درک معنایی از زبانهای انسانی، به تقریب «جالبترین» و
«بهدردخورترین» صفحهها را در پاسخ به یک جستار بیابند. میزان اهمیت یک
صفحه درباره سرگئی پرکوفیف (آهنگساز نامدار روسی) را میتوان تا حدی
براساس شمار صفحههایی که آن را با متن «سرگئی پرکوفیف» لینک کردهاند،
یافت. بخشی از اهمیتش را هم میشود از میزان اهمیت آن صفحهها بر پایه همین
معیار یافت و بخشی را از این که واژه پرکوفیف چند بار در آن صفحه به کار
رفتهاست. بخشی هم از این که چه قدر از چیزهای دیگر در آن صفحه یاد
شدهاست. این نشانگرهای رتبه صفحه را میتوان از آرایش توپولوژیک وب و
تحلیل واژهای متن دریافت، بدون نیاز به درکی معنایی یا هستیشناختی
(آنتولوژیکال) از محتوای صفحه. به جای سرگئی پرکوفیف ممکن است در پی
معدنکاوی سلنیوم باشیم.
مسئله درک زبان انسانی توسط ماشینها حل
نشدهبود، اما بلافاصله معلوم شد که پاسخهای گوگل بسیار بهتر از پاسخهای
هر جستوجوگر دیگری بودند. گوگل در پاسخ به جستارها، صفحههای مربوطتر و
غنیتری در مقایسه با همه جستوجوگرهای دیگر در همه زمانهای پیشین،
بازمیگرداند. از نگاهی بیرونی، گوگل پارادایم بنیادی جستوجو را دگرگون
نکرد. کاربر همچنان کلیدواژههایی را میجست و نتیجههایی میگرفت. اما
بهبود در رتبهبندی چنان ژرف و چشمگیر بود که گوگل به سرعت از هماوردانش
پیشی گرفت.
کامروایی بزرگ گوگل به جای تاکید بر وضع اسفبار تحلیل
معنایی، نشان دادهاست که بدون درگیر شدن با این چالش، چه قدر میتوان پیش
رفت!
پول
زیرنگاشتی
از تاریخ جستوجو را بخوانیم: سرمایهگذار مخاطرهجویی به نام پل گراهام
که در پایان دهه 90 در یاهو برنامهنویس بود، در یادداشتی با عنوان «بر سر
یاهو چه آمد»، مانعهای روانی بر سر بهبود جستوجوی وب را یادآور میشود:
یادم
هست در اواخر سال 1998 یا اوایل سال 1999 به دیوید فیلو (مدیر اجرایی یاهو
در آن زمان) گفتم یاهو باید گوگل را بخرد، چون در آن زمان، من و بیشتر
برنامهنویسان دیگر در یاهو برای جستوجوی وب از گوگل بهجای یاهو استفاده
میکردیم. او به من گفت که این مسئله ارزش نگرانی ندارد. جستوجوی وب تنها 6
درصد ترافیک ما را تشکیل میداد و نرخ رشد ماهانه ما 10 درصد بود. جستوجو
ارزش بهبود را نداشت.
من نگفتم که «اما ترافیک جستوجو باارزشتر از
ترافیکهای دیگر است.»، گفتم: «آه، باشد.»، چرا که من هم نمیدانستم ارزش
ترافیک جستوجو چهقدر بود. مطمئن نیستم آن موقع حتی لری و سرگئی هم ارزشش
را میدانستند. اگر میدانستند، لابد گوگل کوششهایش را در زمینه جستوجوی
سازمانی افزایش نمیداد.
اگر شرایط دیگری بود، شاید گردانندگان یاهو
زودتر درمییافتند که جستوجو چهقدر مهم بود. اما تیرهترین مانع جهان
میان آنها و حقیقت قرار داشت: پول. تا هنگامی که مشتریها چکهای بزرگی
برای آگهی دادن در بالای صفحه مینوشتند، دشوار میشد جستوجوی وب را جدی
گرفت. گوگل چنان عامل اغفالکنندهای نداشت.
ویکیپدیا
کامپیوترها
به پیمودن راه گوگل ادامه میدهند، نه راه Jeeves: تحلیل غیرمعنایی انبوهی
از دادهها. هوشمندی معناشناسانه از عرصه جستوجو کاملاً هم غایب نبوده،
اما به حاشیه رانده شدهاست. نبوغ استفاده از توپولوژی وب به جای مفهوم آن،
در این است که میتوانید از ردهبندیهای انجامشده به دست هوش واقعی
بهره ببرید؛ انسانهایی که پیوندهای وب و بقیه نشانگرهایی را ساختهاند
که میگویند چه چیزی برای آنها مهم و سودمند است.
بزرگترین آزمایش در
گونه دیگری از برونسپاری به تودههای مردم، یعنی ویکیپدیا، بار
سازماندهی کردن اطلاعات را نیز بر گرده انسانها نهادهاست. نتیجههای آن
شگفتانگیز بودهاند. اگرچه جیمی ویلز پذیرفتهاست که محتوای ویکیپدیا
قابل اتکا یا دارای کیفیت دانشگاهی نیست، امروزه این سایت عملاً نخستین
مرجع اطلاعاتی درباره هر موضوع به نسبت جدی است. صفحههای ویکیپدیا نخستین
نتیجههای جستوجو روی گوگل و بینگ در هر زمینهای هستند؛ از آبراهام
لینکلن تا دانته تا triskaidekaphobia (ترس خرافی از عدد 13)! کیفیت
مدخلهای آن نیز در طول سالیان، بهبودی چشمگیر یافته و همچنان بهبود
مییابد.
بدیهی است که دشواریهایی نیز وجود دارد. جدالهایی میان
یاریگران ویکی رخ میدهد (میتوانید در تاریخچه ویرایش هر مدخل
جنجالبرانگیزی از Ayn Rand گرفته تا مالیات و...آنها را ببینیدشان که با
هم رقابت میکنند) و بهتازگی یکی از نخبگان درونی ویکی پیشنهاد دادهاست
که کنترل بیشتری بر ویراستها باشد تا همهچیز مرتب و پاک از هجو باشد.
پوشش موضوعی ویکیپدیا گرایشی شدید به سوی موضوعهایی دارد که
یاریدهندگانش در آن تخصص دارند. به همین دلیل است که مدخل خوزه دونوسو،
نویسنده شیلیایی تنها سه پاراگراف دارد و در برابر، مدخل مجموعه طنز
تلویزیونی کمیک ژاپنی manga Sailor Moon افزون بر پنجاه صفحه است. افزون بر
این، ویکیپدیا هنوز متکی بر محتوای تاریخگذشتهای است که از منبعهای
همگانیشده میآیند، خصوصاً از دایرهالمعارف بریتانیکای 1911. خشنترین
مدخلهای نژادپرستانه آن به دست ویکیپدیا جراحی شدهاند و مدخلهایی دیگر
نیز برای بازبینی و جایگزینی نشانگذاری شدهاند، اما هزاران مدخل آن هنوز
به شکل کامل در ویکی هستند یا از بخشی از برخی از آنها استفاده شدهاست.
از
جنبه معنایی، ویکیپدیا کوشیدهاست تا با دستهبندی مقالههای خود، به
انبوه متن درونش ساختار ببخشد. شوربختانه این فرآیند تصادفیتر از آن بوده
که برآیندش فراگیری لازم برای استفاده توسط کامپیوتر را داشتهباشد.
طرفداران موسیقی راک پیشرو (progressive rock) صفحهای برای Etron Fou
Leloublan ساختهاند، اما در حالی که این گروه در رده «گروههای موسیقی
تجربی فرانسه» و «راک مقاومت» طبقهبندی شده، در رده «گروههای راک پیشرو»،
«راک تجربی»، «راک هنری» یا «موسیقی نوگرا» قرار نگرفته، در حالی که همه
این گروهها به شکل دستههایی ناقص در ویکیپدیا وجود دارند. کتاب حلقههای
کیوان (زحل) از W. G. Sebald در ویکیپدیا در رده داستانها قرار گرفته،
در حالی که کتابخانه کنگره نظر دیگری دارد.
Wilhelm von Humboldt در رده
«زبانشناسان آلمانی»، «فیلسوفان آلمانی»، «فیلسوفان مسیحی»، «لیبرالهای
کلاسیک»، «افراد اهل پتسدام» و چندین دسته دیگر قرار گرفتهاست، نه در دسته
پژوهندگان ادبیات باستانی، انسانشناسان، منتقدان ادبی یا زبانشناسان
تاریخی و تطبیقی. چنین مشکلهایی تهدیدکننده هدف ویکیپدیا نیستند اما نشان
میدهند که حتی با تلاشی هماهنگ، به هم پیوستن مشارکتهای نوشتاری مردمان
مختلف در قالب دستههای معنایی همهگیر و مشخص، بسیار دشوار است. هیچ دلیل
فنیای وجود ندارد که نگذارد ویکیپدیا روزی، دربرگیرنده همه دانش جهان
شود. اما ساختار آن چیزی نخواهدبود که کامپیوترها بتوانند بفهمند.
پیدایش هستیشناسیها
با
بحث ویکیپدیا و دستهبندیهای ناقصش، وارد حیطه هستیشناسی (آنتولوژی)
میشویم. این واژه ابتدا به معنی پژوهیدن فلسفی سرشت هستی بود اما در متن
علوم اطلاعات، معنایی متفاوت به خود گرفت که به مدلسازی واقعیت مربوط
میشود. اساساً یک هستیشناسی، تعریف صریح و صوری یک چارچوب مفهومی
دربرگیرنده هر شماری از چیزها است و نیز هر شماری از رابطههای میان آنها.
بر خلاف علم ردهبندی (taxonomy) که تنها رتبهبندی چیزها بر پایه یک
رابطه است،
یک هستیشناسی میتواند دربرگیرنده هر
شماری از رابطههای رتبهای و غیررتبهای میان چیزهای درونش باشد، اما
کلیدواژههای آن «صریح» و «صوری» هستند. طبق تعریف، یک هستیشناسی
مدلسازیای از واقعیت است که به کار بازنمایی منطقی میآید.
گنگیها و
محدودیتهای درون یک هستیشناسی، میتوانند دردسرساز باشند. به عنوان
نمونهای ساده، دولت چین شهروندانش را وادار کرد تا اگر نام هر کدامشان
حرفی داشت که کامپیوترهای دولت نمیشناختند، نام خود را عوض کنند. در موردی
پیچیدهتر، در آغاز سال 2009، سایت آمازون در اقدامی مرموز، رتبهبندی
شمار زیادی از کتابهایی که زمینه نوعی گرایش غیر اخلاقی داشتند را تغییر
داد، که موجب کاهش شدید نمایش آنها در این سایت شد. مایک دِیزی، یکی از
کارکنان پیشین آمازون، توضیحی باورپذیر برای این پدیده میدهد: «یکی از
کارکنان آمازون در فرانسه هنگام ویراستن سایت دچار سردرگمی شده، و واژه
adult را که برای محتوای هرزهنگارانه به کار میبرند، با واژههایی مانند
«هوسانگیز» و «جنسیت» اشتباه گرفت». آمازون رتبهبندی هر کتابی را که
هرزهنگارانه تشخیص دهد، تغییر میدهد، بنابراین هنگامی که «هوسانگیز» و
«جنسیت» هرزهنگاری انگاشته شدند، اثر آن به شکلی نامتناسب به کتابهایی که
مضمون گرایش غیر اخلاقی مذکور داشتند نیز رسید. خشمی که در پی این کار
آمازون ایجاد شد، قابل درک بود، زیرا اگرچه نیتی برای نشانه رفتن ادبیات آن
گرایش وجود نداشت، هستیشناسیهای موجود تا پیش از آن، بخشهای ریز و
درشتی از این رده کتابها را به ردههای «هوسانگیز» و «جنسیت» پیوسته
بودند.برای نمونه، کتابهای دو نویسنده متفاوت میزان مشابهی از محتوای
جنسیتی دارند، اما فقط یکی از آن دو از فهرست بیرون آوردهشدهبود. به این
شکل، جانبداری رخنه کرده در هستیشناسی زیرین این ساختار نمایان شد، که
اگرچه توسط کامپیوترها ساخته نشدهبود، اما آنها به گسترشش کمک کرده
بودند.
اینگونه هستیشناسیها همیشه وجود داشتهاند؛ از مثالهای ارسطو
گرفته تا اختربینی و راهنمای تشخیصی و آماری آشفتگیهای روانی (DSM). ما
متکی بر این دستهبندیها هستیم، چون از پیچیدگی جهان برای ما میکاهند.
همچون نژاد و جنسیت، اینها هم رستههایی فرهنگی هستند که نمو زیستی دارند و
نیز جانبداریها و نارساییهایی پویا. هنگامی که طبقهبندی یک کتاب برای
کتابخانه کنگره دشوار باشد، یا سیستم هستیشناختی خود را میپالایند، یا آن
کتاب را به بهترین شکلی که بتوانند، در سیستم موجودشان جای میدهند.
مسئله همیشه یافتن بهترین تقریب است.
چون کامپیوترها نمیتوانند ردههای
هستیشناختی معناداری بسازند و چون ساختن هستیشناختهای تازه نیازمند
پذیرش جمعی است تا بتوانند مورد استفاده قرار گیرند، عملیترین رهیافت آن
است که مصرفکنندگان چشمداشتی یک هستیشناسی را واداریم خودشان آن را
بسازند و نگه دارند. این فرآیند را میتوان تودهسپاری هستیشناسی خواند.
آمازون
رستههای
ویکیپدیا چنان اتفاقیاند که هیچکس نمیتواند آنها را مقتدرانه به کار
گیرد. اما هستیشناختهای موجود و صریح چه؟ برخلاف جهان مسطح جستوجو با
همه سهلانگاری معناییاش، هستیشناسیهایی مرتب و معنایی در همه جای یکی
دیگر از کار و بارهای اینترنتی حضور دارند: خرید. چیزهایی مانند دادههای
کتابخانه کنگره در مورد کتابها، مشخصات فنی لوازم الکترونیکی و ردههای
سنی بازیچههای کودکان، همگی رستهبندیهایی هستند که به محصولات تجاری
پیوستهاند و در عمل فراداده (متادیتای) آنها هستند که برای هر یک از
آنها یک هستیشناسی آماده استفاده فراهم کردهاند. تا پیش از آن که کار به
کامپیوترها سپردهشود، این ردهبندیها بیش از نیمی از کار را انجام
دادهاند. کامپیوترها به آسانی با چنین هستیشناختهایی کار میکنند، چرا
که کمترین گنگی ممکن را دارند. خرید و فروش کالا، مجموعهای از رستههای
آماده را فراهم میآورد که نیازمند درک کامپیوتر از روابط سازنده آن نیست.
همه کار این است که هستیشناختهای مرتبکننده موجود را وارد وب کنیم. اگر
ویژگیهای یک هستیشناسی موجود باشند، کامپیوترها مجبور نمیشوند مسیر پر
پیچ و خم پر کردن جاهای خالی آنها را بپیمایند. همه گنگیهای باقیمانده
را باید به شکل دستی پالود.
از میان همه شرکتهای آنلاین، آمازون
بیشترین بهره را از این هستیشناسیهای آماده بردهاست. آنها مجبور نبودند
ردهبندی خود را به مردم یا به کامپیوترها توضیح دهند، چرا که هر دو سو بر
چیستی این ردهبندی توافق داشتند. در نخستین روزهای وب، ردهبندیهای یاهو
سلیقهای و بحثبرانگیز مینمودند: «طنز» میتوانست هر چیزی باشد، صفحهای
از بریدهگوییهای Sam Kinison، مجموعهای از جوکهای تکخطی Henny
Youngman یا همه کتاب Tristram Shandy، بدون هیچ تفکیک دیگری میان لینکها.
و صفحههایی که در این مجموعه گنجانده نشدهبودند بسیار پرشمارتر از
آنهایی بود که فهرست میشدند.
پس یاهو نبرد را به جستوجو واگذار کرد.
اما رستههای آمازون، مانند «لوازم الکترونیکی»، «اثاث خانه» و «جواهرات»،
جاافتاده و فراگیر بودند. میتوانستند به مشتریها بگویند کدام توسترها بیش
از همه فروش داشتهاند، کدام توسترها کدام ویژگیها را دارند و کسانی که
توستری مانند شما خریدهاند، کدام مایکروویوها را خریدهاند. هستیشناسی از
پیش موجود بود.
آمازون همه تاریخچه خریدهای شما را هم داشت و سرورهای
آن میتوانستند فوراً پیشنهادهایی محاسبه کنند که احتمال پذیرفتنشان از
سوی شما زیاد باشد. برای نمونه، هنگامی که کتابی را روی سایت آمازون مرور
میکنید یا از آن میخرید، آمازون میتواند براساس فاکتورهای پرشماری،
کتابهایی دیگر به شما پیشنهاد کند: نویسنده کتاب، رسته موضوعی آن، تاریخ
نشر کتاب و ناشر آن، فهرست خواستنیهای شما، تاریخچه خریدهایتان، تاریخچه
خریدهای آنان که این کتاب را خریده یا روی سایت مرور کردهاند، مکان
جغرافیایی شما، تاریخچه خریدهای افراد دیگر در مکان جغرافیایی شما و
دادههای شخصیتان (سن، جنسیت، وضعیت تأهل و این که فرزند دارید یا نه)،
آنگونه که از خریدهایتان برمیآید.
اگرکسی که مرتباً پوشک بچه میخرد،
کتابی از ژان پیاژه بخرد، ممکن است باز هم کتابی درباره پرورش کودک بخرد،
در حالی که اگر کسی کتابی از ژان پیاژه و کتابی از L. S. Vygotsky بخرد، به
احتمال کتابهای دیگری در زمینه روانشناسی خواهدخرید. دشواریهای پیش
روی آمازون در ارائه پیشنهادهایش، متفاوت از چالشهایی است که موتورهای
جستوجو با آنها مواجهند. موتورهای جستوجو باید با اطلاعات هستیشناختی
انگشتشمار کار کنند، چون فهمیدهایم بسیار دشوار است که روی وب براساس یک
هستیشناسی کار کرد. آمازون یک هستیشناسی منظم و دستهبندیشده دارد،
بنابراین باید که دریابد که رستههای گوناگون درون آن هستیشناسی چگونه به
هم مربوط هستند و به این شکل دادههای بیشتری درباره هستیشناخت موجود
بهدست آورد. برای کامپیوتر، همه اینها درنهایت کار کردن با نمادها است،
اما سرشت دادهها در این دو مورد بسیار متفاوت از هم است.
آمازون همچنان
مشکلهایی دارد. جدا از مبهم بودن برخی رستهها ممکن است به سادگی
دشواریهایی در وارد کردن فراداده وجود داشتهباشد. آمازون ادعا میکند که
در اثر استفاده از عنوان گزارش به جای فهرست نویسندگان، چندین گزارش واردات
و صادرات گوشت را سهگانه Chilled the Fresh، Frozen Horse و Ass Meat
Research Group نوشتهاند! اینگونه اشتباهها را باید دستی اصلاح کرد،
چراکه راه آسانی برای تشخیص دادنشان توسط کامپیوتر وجود ندارد (چگونه
کامپیوتر میتواند چنین اشتباهی را بیابد؟ بسیاری از نامهای انسانی، حاوی
واژههای عادی زبان هستند و نیز، بسیاری از گروههای پژوهشی یا محصولها
نیز نامهای عجیب و غریب دارند). داشتن فراداده صریح موجب کاهش شمار چنین
خطاهایی میشود که انسانها باید بیابند و اصلاح کنند.
آمازون شیفته آن
است که بیشتر بداند. اگر سابقه پزشکی من را داشتند، میتوانستند قرصهایی
برای سردردهایم توصیه کنند. اگر از محتوای کتابخانهام خبر داشتند، دیگر
کتابهایی که جایی دیگر خریدهام را به من پیشنهاد نمیکردند. اگر
میدانستند دارم این مقاله را مینویسم، کتابهایی درباره آینده کامپیوترها
به من پیشنهاد میکردند!