پایگاه خبری فناوری اطلاعات(Id: پیشگامان کامپیوتر)

ترفندهای روز.خبرهای ازدنیای تکنولوژی.خبرهایی از دنیای گیمرها.رفع مشکلات شمادرکامپیوتر

پایگاه خبری فناوری اطلاعات(Id: پیشگامان کامپیوتر)

ترفندهای روز.خبرهای ازدنیای تکنولوژی.خبرهایی از دنیای گیمرها.رفع مشکلات شمادرکامپیوتر

نادانی کامپیوترها - بخش دوم

امروزه کامپیوترها مخزن‌های تقریباً همه‌کاره توان پردازشی‌ هستند، با این حال احمق هم هستند. آن‌ها قهرمانان مسلم شطرنج در جهان هستند اما نمی‌توانند یک گفت‌وگوی ساده انگلیسی را درک کنند. ابرکامپیوتر واتسون شرکت آی بی ام در سال ۲۰۱۱ توانست دو شرکت‌کننده برتر Jeopardy (یک مسابقه تلویزیونی دانستنی‌های عمومی بسیار مشهور در امریکا) را شکست دهد، اما .......
بخش اول

برای مشاهده ادامه خبر به ادامه مطلب مراجعه کنید

در پاسخ به پرسش «ملخ‌ها چه می‌خورند؟» واتسون پاسخ داد: «کوشر». واتسون، یکی از بزرگترین ماشین‌هایی که انسان تاکنون ساخته، با وجود همه داده‌هایی که می‌توانست در کسری از ثانیه به آن‌ها دسترسی پیدا کند، بد جوری خنگ جلوه کرد.

Gonz
با این حال، کامپیوترها توانسته‌اند گاهی با تقلب کردن به پیروزی‌های نادری برسند. در سال 1989 یک متخصص علوم کامپیوتر به نام مارک هامفریس (Mark Humphrys) یک چت‌بات بسیار ابتدایی به نام MGonz نوشت که نه‌تنها کاربر دیگر (در دانشگاه دریک، که توسط یک چت‌روم ابتدایی آنلاین به آن دسترسی می‌یافت) را متقاعد می‌کرد که یک انسان است، بلکه او را با سرزنش، وادار به اعتراف هم می‌کرد:
mgonz: آخرین باری که سیگار کشیدی کِی بود؟
کاربری در دریک: دیروز.
mgonz: خوب، راستش را بگو، آخرین باری که لب به سیگار زدی کِی بود؟
کاربری در دریک: گفتم که دیروز بود.
mgonz: اصلاً معلوم است که آدم بی سر و پایی هستی.
mgonz: خوب، راستش را بگو، آخرین باری که لب به سیگار زدی کِی بود؟
کاربری در دریک: خیلی خوب، باشد. 24 ساعت پیش بود. انگار خودت 20 سالی می‌شود که طرفش نرفته‌ای.
MGonz هیچ درکی از آن‌چه که طرف مقابلش می‌گفت، نداشت، اما چنان که Humphrys می‌گوید، از راه «بی‌احترامی، پرخاشگری بی‌رحمانه، جستارهای هرزه درباره کاربر و ایجاب ضمنی دروغ‌گو بودن کاربر» موفق می‌شد.

زبان
با هر چیزی پیچیده‌تر از بلوک‌های قرمز (یا بی‌احترامی و بدرفتاری) به مشکل بیان منطقی زبان برمی‌خوردید. مسئله دو سطح داشت: نخست نرم‌افزاری باید می‌توانست ابهام ذاتی درون دستور زبان و معناشناسی یک جمله را حل و فصل کند. جمله ساده‌ای مانند «اگر تو بیایی، به فروشگاه می‌روم» را در نظر بگیرید. برای یک پارسی‌زبان، این جمله بی‌ابهام است. معنی‌اش می‌شود «تنها در صورتی که با من (و هم‌زمان با من) بیایی، من به فروشگاه خواهم‌رفت.» اما برای کامپیوتر شاید گیج‌کننده باشد: «یعنی چه که به فروشگاه می‌روم؟ (چند بار؟ و به کدام فروشگاه؟) اگر تو، به طور کلی (یا به طور معمول) به فروشگاه بروی، یا همین اکنون با من به فروشگاه بروی؟» بخشی از این مشکل به واژه «اگر» بازمی‌گردد که در شرایط مختلف می‌تواند به شکل‌های متفاوتی محدودکننده منظور باشد و بخشی نیز به مفهوم «فروشگاه» مربوط است. اما واژه‌های بسیاری مانند «اگر» وجود دارد و نیز مفهوم‌های بسیاری همچون «فروشگاه» و شرایط بسیاری با ابهام بسیار بیشتر: ارجاع‌های غیرقطعی، بسترهای مبهم مفهومی و اصطلاح‌های نامأنوس. منطق نمادی نمی‌تواند چنان گنگی‌هایی را بپذیرد: این‌ مفاهیم باید در ترجمه از زبان به منطق، به شکل صریح بیان شوند و کامپیوترها نمی‌توانند به‌تنهایی قانون‌های بغرنج، ساختگی و غیرمنطقی فرآیند ترجمه را دریابند.
دوم این که نرم‌افزاری که به کار تحلیل زبان طبیعی می‌پردازد، باید بتواند بفهمد آن جمله چه وضعیتی را به جهان نشان می‌دهد، یا به بیان ساده‌تر، معنی جمله را بفهمد. و این مشکل بزرگ‌تر را آشکار می‌کند: رابطه زبان با جهان چیست؟ مردم در زندگی روزمره همواره با این مسئله بازی می‌کنند: برای کسی چندان مهم نیست که یک مرد دقیقاً چه قدر مو باید از‌دست دهد تا طاس خوانده شود. اگر طاس به نظر برسد، طاس است. حتی در سیستم قضایی هم اگر نیازی رخ دهد، تنها می‌تواند پریشانی زبان‌شناختی را به شکلی موردی سامان دهد. اما جایی که واقعیت باید بدون گنگی (یا دشوارتر از آن، با گنگی دقیقاً مشخصی) در قالب زبان بیان شود، گرفتار آشفته‌ترین بخش‌های مسئله می‌شویم.
فیلسوفان از پایان قرن نوزدهم به این سو با این مسئله درگیر شده‌اند. گاتلوب فرگه، برتراند راسل و پوزیتیویست‌های منطق‌گرا (که عقیده داشتند زبان را می‌توان به بیان منطقی درآورد) در این زمینه پیشرو بوده‌اند، تا آن که در دهه 1940 یکی از هواداران پیشین‌شان (ویتگنشتاین) آن‌ها را به ورطه فراموشی کشاند و W. V. O. Quine در دهه 1950 مغلوب‌شان کرد. اما هواداران نخستین آن‌چه که بعدها با عنوان «هوش مصنوعی معناگرا» شناخته شد، بسیار متأثر از کارهای پوزیتیویست‌های منطق‌گرا بودند و دهه‌ها زمان را صرف کوشش برای نوشتن برنامه‌هایی کردند (و می‌کنند) که به کامپیوترها ابزار درک زبان را بدهد. به استثنای چند وقفه کوتاه، هوش مصنوعی به حرکت خود (مستقل از این گرایش) ادامه داده‌است.

گوگل
در همین هنگام، راه‌هایی برای دور زدن مسئله درک کردن ماشینی زبان انسان پیدا شد. در میانه دهه 1990 شماری از پژوهش‌گران – از جمله مشهورترین‌شان، دو دانشجوی تحصیلات عالی در استنفورد با نام‌های سرگئی برین و لری پیج – در تلاش بودند با رتبه‌بندی کردن یافته‌های جست‌وجوی وب بر‌اساس اهمیت آن‌ها، نتیجه جست‌وجو را بهبود بخشند. آنان دریافتند که کامپیوترها می‌توانند با بررسی توپولوژی وب (این که کدام صفحه به کدام صفحه‌های دیگر لینک دارد) بدون داشتن هیچ درک معنایی از زبان‌های انسانی، به تقریب «جالب‌ترین» و «به‌دردخورترین» صفحه‌ها را در پاسخ به یک جستار بیابند. میزان اهمیت یک صفحه درباره سرگئی پرکوفیف (آهنگساز نامدار روسی) را می‌توان تا حدی بر‌اساس شمار صفحه‌هایی که آن را با متن «سرگئی پرکوفیف» لینک کرده‌اند، یافت. بخشی از اهمیتش را هم می‌شود از میزان اهمیت آن صفحه‌ها بر پایه همین معیار یافت‌ و بخشی را از این که واژه پرکوفیف چند بار در آن صفحه به کار رفته‌است. بخشی هم از این که چه قدر از چیزهای دیگر در آن صفحه یاد شده‌است. این نشانگرهای رتبه صفحه را می‌توان از آرایش توپولوژیک وب و تحلیل واژه‌ای متن دریافت، بدون نیاز به درکی معنایی یا هستی‌شناختی (آنتولوژیکال) از محتوای صفحه. به جای سرگئی پرکوفیف ممکن است در پی معدن‌کاوی سلنیوم باشیم.
مسئله درک زبان انسانی توسط ماشین‌ها حل نشده‌بود، اما بلافاصله معلوم شد که پاسخ‌های گوگل بسیار بهتر از پاسخ‌های هر جست‌وجوگر دیگری بودند. گوگل در پاسخ به جستارها، صفحه‌های مربوط‌تر و غنی‌تری در مقایسه با همه جست‌وجوگرهای دیگر در همه زمان‌های پیشین، بازمی‌گرداند. از نگاهی بیرونی، گوگل پارادایم بنیادی جست‌وجو را دگرگون نکرد. کاربر همچنان کلیدواژه‌هایی را می‌جست و نتیجه‌هایی می‌گرفت. اما بهبود در رتبه‌بندی چنان ژرف و چشم‌گیر بود که گوگل به سرعت از هماوردانش پیشی گرفت.
کامروایی بزرگ گوگل به جای تاکید بر وضع اسف‌بار تحلیل معنایی، نشان داده‌است که بدون درگیر شدن با این چالش، چه قدر می‌توان پیش رفت!

پول
زیرنگاشتی از تاریخ جست‌وجو را بخوانیم: سرمایه‌گذار مخاطره‌جویی به نام پل گراهام که در پایان دهه 90 در یاهو برنامه‌نویس بود، در یادداشتی با عنوان «بر سر یاهو چه آمد»، مانع‌های روانی بر سر بهبود جست‌وجوی وب را یادآور می‌شود:
یادم هست در اواخر سال 1998 یا اوایل سال 1999 به دیوید فیلو (مدیر اجرایی یاهو در آن زمان) گفتم یاهو باید گوگل را بخرد، چون در آن زمان، من و بیشتر برنامه‌نویسان دیگر در یاهو برای جست‌وجوی وب از گوگل به‌جای یاهو استفاده می‌کردیم. او به من گفت که این مسئله ارزش نگرانی ندارد. جست‌وجوی وب تنها 6 درصد ترافیک ما را تشکیل می‌داد و نرخ رشد ماهانه ما 10 درصد بود. جست‌وجو ارزش بهبود را نداشت.
من نگفتم که «اما ترافیک جست‌وجو باارزش‌تر از ترافیک‌های دیگر است.»، گفتم: «آه، باشد.»، چرا که من هم نمی‌دانستم ارزش ترافیک جست‌وجو چه‌قدر بود. مطمئن نیستم آن موقع حتی لری و سرگئی هم ارزشش را می‌دانستند. اگر می‌دانستند، لابد گوگل کوشش‌هایش را در زمینه جست‌وجوی سازمانی افزایش نمی‌داد.
اگر شرایط دیگری بود، شاید گردانندگان یاهو زودتر درمی‌یافتند که جست‌وجو چه‌قدر مهم بود. اما تیره‌ترین مانع جهان میان آن‌ها و حقیقت قرار داشت: پول. تا هنگامی که مشتری‌ها چک‌های بزرگی برای آگهی دادن در بالای صفحه می‌نوشتند، دشوار می‌شد جست‌وجوی وب را جدی گرفت. گوگل چنان عامل اغفال‌کننده‌ای نداشت.

ویکی‌پدیا
کامپیوترها به پیمودن راه گوگل ادامه می‌دهند، نه راه Jeeves: تحلیل غیرمعنایی انبوهی از داده‌ها. هوشمندی معناشناسانه از عرصه جست‌وجو کاملاً هم غایب نبوده، اما به حاشیه رانده شده‌است. نبوغ استفاده از توپولوژی وب به جای مفهوم آن، در این است که می‌توانید از رده‌بندی‌های انجام‌شده به دست هوش واقعی بهره‌ ببرید؛ انسان‌هایی که پیوندهای وب و بقیه نشان‌گرهایی را ساخته‌اند که می‌گویند چه چیزی برای آن‌ها مهم و سودمند است.
بزرگ‌ترین آزمایش در گونه دیگری از برون‌سپاری به توده‌های مردم، یعنی ویکی‌پدیا، بار سازمان‌دهی کردن اطلاعات را نیز بر گرده انسان‌ها نهاده‌است. نتیجه‌های آن شگفت‌انگیز بوده‌اند. اگرچه جیمی ویلز پذیرفته‌است که محتوای ویکی‌پدیا قابل اتکا یا دارای کیفیت دانشگاهی نیست، امروزه این سایت عملاً نخستین مرجع اطلاعاتی درباره هر موضوع به نسبت جدی است. صفحه‌های ویکی‌پدیا نخستین نتیجه‌های جست‌وجو روی گوگل و بینگ در هر زمینه‌ای هستند؛ از آبراهام لینکلن تا دانته تا triskaidekaphobia (ترس خرافی از عدد 13)! کیفیت مدخل‌های آن نیز در طول سالیان، بهبودی چشم‌گیر یافته و همچنان بهبود می‌یابد.
بدیهی است که دشواری‌هایی نیز وجود دارد. جدال‌هایی میان یاری‌گران ویکی رخ می‌دهد (می‌توانید در تاریخچه ویرایش هر مدخل جنجال‌برانگیزی از Ayn Rand گرفته تا مالیات و...آن‌ها را ببینیدشان که با هم رقابت می‌کنند) و به‌تازگی یکی از نخبگان درونی ویکی پیشنهاد داده‌است که کنترل بیشتری بر ویراست‌ها باشد تا همه‌چیز مرتب و پاک از هجو باشد. پوشش موضوعی ویکی‌پدیا گرایشی شدید به سوی موضوع‌هایی دارد که یاری‌دهندگانش در آن تخصص دارند. به همین دلیل است که مدخل خوزه دونوسو، نویسنده شیلیایی تنها سه پاراگراف دارد و در برابر، مدخل مجموعه طنز تلویزیونی کمیک ژاپنی manga Sailor Moon افزون بر پنجاه صفحه است. افزون بر این، ویکی‌پدیا هنوز متکی بر محتوای تاریخ‌گذشته‌ای است که از منبع‌های همگانی‌شده می‌آیند، خصوصاً از دایره‌المعارف بریتانیکای 1911. خشن‌ترین مدخل‌های نژادپرستانه آن به دست ویکی‌پدیا جراحی شده‌اند و مدخل‌هایی دیگر نیز برای بازبینی و جایگزینی نشان‌گذاری شده‌اند، اما هزاران مدخل آن هنوز به شکل کامل در ویکی هستند یا از بخشی از برخی از آن‌ها استفاده شده‌است.
از جنبه معنایی، ویکی‌پدیا کوشیده‌است تا با دسته‌بندی مقاله‌های خود، به انبوه متن درونش ساختار ببخشد. شوربختانه این فرآیند تصادفی‌تر از آن بوده که برآیندش فراگیری لازم برای استفاده توسط کامپیوتر را داشته‌باشد. طرفداران موسیقی راک پیشرو (progressive rock) صفحه‌ای برای Etron Fou Leloublan ساخته‌اند، اما در حالی که این گروه در رده «گروه‌های موسیقی تجربی فرانسه» و «راک مقاومت» طبقه‌بندی شده، در رده «گروه‌های راک پیشرو»، «راک تجربی»، «راک هنری» یا «موسیقی نوگرا» قرار نگرفته، در حالی که همه این گروه‌ها به شکل دسته‌هایی ناقص در ویکی‌پدیا وجود دارند. کتاب حلقه‌های کیوان (زحل) از W. G. Sebald در ویکی‌پدیا در رده داستان‌ها قرار گرفته، در حالی که کتابخانه کنگره نظر دیگری دارد.
Wilhelm von Humboldt در رده «زبان‌شناسان آلمانی»، «فیلسوفان آلمانی»، «فیلسوفان مسیحی»، «لیبرال‌های کلاسیک»، «افراد اهل پتسدام» و چندین دسته دیگر قرار گرفته‌است، نه در دسته پژوهندگان ادبیات باستانی، انسان‌شناسان، منتقدان ادبی یا زبان‌شناسان تاریخی و تطبیقی. چنین مشکل‌هایی تهدیدکننده هدف ویکی‌پدیا نیستند اما نشان می‌دهند که حتی با تلاشی هماهنگ، به هم پیوستن مشارکت‌های نوشتاری مردمان مختلف در قالب دسته‌های معنایی همه‌گیر و مشخص، بسیار دشوار است. هیچ دلیل فنی‌ای وجود ندارد که نگذارد ویکی‌پدیا روزی، دربرگیرنده همه دانش جهان شود. اما ساختار آن چیزی نخواهدبود که کامپیوترها بتوانند بفهمند.

پیدایش هستی‌شناسی‌ها
با بحث ویکی‌پدیا و دسته‌بندی‌های ناقصش، وارد حیطه هستی‌شناسی (آنتولوژی) می‌شویم. این واژه ابتدا به معنی پژوهیدن فلسفی سرشت هستی بود اما در متن علوم اطلاعات، معنایی متفاوت به خود گرفت که به مدل‌سازی واقعیت مربوط می‌شود. اساساً یک هستی‌شناسی، تعریف صریح و صوری یک چارچوب مفهومی دربرگیرنده هر شماری از چیزها است و نیز هر شماری از رابطه‌های میان آن‌ها. بر خلاف علم رده‌بندی (taxonomy) که تنها رتبه‌بندی چیزها بر پایه یک رابطه است،

یک هستی‌شناسی می‌تواند دربرگیرنده هر شماری از رابطه‌های رتبه‌ای و غیررتبه‌ای میان چیزهای درونش باشد، اما کلیدواژه‌های آن «صریح» و «صوری» هستند. طبق تعریف، یک هستی‌شناسی مدل‌سازی‌ای از واقعیت است که به کار بازنمایی منطقی می‌آید.
گنگی‌ها و محدودیت‌های درون یک هستی‌شناسی، می‌توانند دردسرساز باشند. به عنوان نمونه‌ای ساده، دولت چین شهروندانش را وادار کرد تا اگر نام هر کدام‌شان حرفی داشت که کامپیوترهای دولت نمی‌شناختند، نام خود را عوض کنند. در موردی پیچیده‌تر، در آغاز سال 2009، سایت آمازون در اقدامی مرموز، رتبه‌بندی شمار زیادی از کتاب‌هایی که زمینه نوعی گرایش غیر اخلاقی داشتند را تغییر داد، که موجب کاهش شدید نمایش آن‌ها در این سایت شد. مایک دِیزی، یکی از کارکنان پیشین آمازون، توضیحی باورپذیر برای این پدیده می‌دهد: «یکی از کارکنان آمازون در فرانسه هنگام ویراستن سایت دچار سردرگمی شده، و واژه adult را که برای محتوای هرزه‌نگارانه به کار می‌برند، با واژه‌هایی مانند «هوس‌انگیز» و «جنسیت» اشتباه گرفت». آمازون رتبه‌بندی هر کتابی را که هرزه‌نگارانه تشخیص دهد، تغییر می‌دهد، بنابراین هنگامی که «هوس‌انگیز» و «جنسیت» هرزه‌نگاری انگاشته شدند، اثر آن به شکلی نامتناسب به کتاب‌هایی که مضمون گرایش غیر اخلاقی مذکور داشتند نیز رسید. خشمی که در پی این کار آمازون ایجاد شد، قابل درک بود، زیرا اگرچه نیتی برای نشانه رفتن ادبیات آن گرایش وجود نداشت، هستی‌شناسی‌های موجود تا پیش از آن، بخش‌های ریز و درشتی از این رده کتاب‌ها را به رده‌های «هوس‌انگیز» و «جنسیت» پیوسته بودند.برای نمونه، کتاب‌های دو نویسنده متفاوت میزان مشابهی از محتوای جنسیتی دارند، اما فقط یکی از آن ‌دو از فهرست بیرون آورده‌شده‌بود. به این شکل، جانبداری رخنه کرده در هستی‌شناسی زیرین این ساختار نمایان شد، که اگرچه توسط کامپیوترها ساخته نشده‌بود، اما آن‌ها به گسترشش کمک کرده بودند.
این‌گونه هستی‌شناسی‌ها همیشه وجود داشته‌اند؛ از مثال‌های ارسطو گرفته تا اختربینی و راهنمای تشخیصی و آماری آشفتگی‌های روانی (DSM). ما متکی بر این دسته‌‌بندی‌ها هستیم، چون از پیچیدگی جهان برای ما می‌کاهند. همچون نژاد و جنسیت، این‌ها هم رسته‌هایی فرهنگی هستند که نمو زیستی دارند و نیز جانبداری‌ها و نارسایی‌هایی پویا. هنگامی که طبقه‌بندی یک کتاب برای کتابخانه کنگره دشوار باشد، یا سیستم هستی‌شناختی خود را می‌پالایند، یا آن کتاب را به بهترین شکلی که بتوانند، در سیستم موجود‌شان جای می‌دهند. مسئله همیشه یافتن بهترین تقریب است.
چون کامپیوترها نمی‌توانند رده‌های هستی‌شناختی معناداری بسازند و چون ساختن هستی‌شناخت‌های تازه نیازمند پذیرش جمعی است تا بتوانند مورد استفاده قرار گیرند، عملی‌ترین رهیافت آن است که مصرف‌کنندگان چشم‌داشتی یک هستی‌شناسی را واداریم خودشان آن را بسازند و نگه دارند. این فرآیند را می‌توان توده‌سپاری هستی‌شناسی خواند.

آمازون
رسته‌های ویکی‌پدیا چنان اتفاقی‌اند که هیچ‌کس نمی‌تواند آن‌ها را مقتدرانه به کار گیرد. اما هستی‌شناخت‌های موجود و صریح چه؟ بر‌خلاف جهان مسطح جست‌وجو با همه سهل‌انگاری معنایی‌اش، هستی‌شناسی‌هایی مرتب و معنایی در همه جای یکی دیگر از کار و بارهای اینترنتی حضور دارند: خرید. چیزهایی مانند داده‌های کتابخانه کنگره در مورد کتاب‌ها، مشخصات فنی لوازم الکترونیکی و رده‌های سنی بازیچه‌های کودکان، همگی رسته‌بندی‌هایی هستند که به محصولات تجاری پیوسته‌اند و در عمل فراداده‌ (متادیتای) آن‌ها هستند که برای هر یک از آن‌ها یک هستی‌شناسی آماده استفاده فراهم کرده‌اند. تا پیش از آن که کار به کامپیوترها سپرده‌شود، این رده‌بندی‌ها بیش از نیمی از کار را انجام داده‌اند. کامپیوترها به آسانی با چنین هستی‌شناخت‌هایی کار می‌کنند، چرا که کمترین گنگی ممکن را دارند. خرید و فروش کالا، مجموعه‌ای از رسته‌های آماده را فراهم می‌آورد که نیازمند درک کامپیوتر از روابط سازنده آن نیست. همه کار این است که هستی‌شناخت‌های مرتب‌کننده موجود را وارد وب کنیم. اگر ویژگی‌های یک هستی‌شناسی موجود باشند، کامپیوترها مجبور نمی‌شوند مسیر پر پیچ و خم پر کردن جاهای خالی آن‌ها را بپیمایند. همه گنگی‌های باقی‌مانده را باید به شکل دستی پالود.
از میان همه شرکت‌های آنلاین، آمازون بیشترین بهره را از این هستی‌شناسی‌های آماده برده‌است. آن‌ها مجبور نبودند رده‌بندی خود را به مردم یا به کامپیوترها توضیح دهند، چرا که هر دو سو بر چیستی این رده‌بندی توافق داشتند. در نخستین روزهای وب، رده‌بندی‌های یاهو سلیقه‌ای و بحث‌برانگیز می‌نمودند: «طنز» می‌توانست هر چیزی باشد، صفحه‌ای از بریده‌گویی‌های Sam Kinison، مجموعه‌ای از جوک‌های تک‌خطی Henny Youngman یا همه کتاب Tristram Shandy، بدون هیچ تفکیک دیگری میان لینک‌ها. و صفحه‌هایی که در این مجموعه گنجانده نشده‌بودند بسیار پرشمارتر از آن‌هایی بود که فهرست می‌شدند.

پس یاهو نبرد را به جست‌وجو واگذار کرد. اما رسته‌های آمازون، مانند «لوازم الکترونیکی»، «اثاث خانه» و «جواهرات»، جاافتاده و فراگیر بودند. می‌توانستند به مشتری‌ها بگویند کدام توسترها بیش از همه فروش داشته‌اند، کدام توسترها کدام ویژگی‌ها را دارند و کسانی که توستری مانند شما خریده‌اند، کدام مایکروویوها را خریده‌اند. هستی‌شناسی از پیش موجود بود.
آمازون همه تاریخچه خریدهای شما را هم داشت و سرورهای آن می‌توانستند فوراً پیشنهادهایی محاسبه کنند که احتمال پذیرفتن‌شان از سوی شما زیاد باشد. برای نمونه، هنگامی که کتابی را روی سایت آمازون مرور می‌کنید یا از آن می‌خرید، آمازون می‌تواند بر‌اساس فاکتورهای پرشماری، کتاب‌هایی دیگر به شما پیشنهاد کند: نویسنده کتاب، رسته موضوعی آن، تاریخ نشر کتاب و ناشر آن، فهرست خواستنی‌های شما، تاریخچه خریدهای‌تان، تاریخچه خریدهای آنان که این کتاب را خریده یا روی سایت مرور کرده‌اند، مکان جغرافیایی شما، تاریخچه خریدهای افراد دیگر در مکان جغرافیایی شما و داده‌های شخصی‌تان (سن، جنسیت، وضعیت تأهل و این که فرزند دارید یا نه)، آن‌گونه که از خریدهای‌تان برمی‌آید.
اگرکسی که مرتباً پوشک بچه می‌خرد، کتابی از ژان پیاژه بخرد، ممکن است باز هم کتابی درباره پرورش کودک بخرد، در حالی که اگر کسی کتابی از ژان پیاژه و کتابی از L. S. Vygotsky بخرد، به احتمال کتاب‌های دیگری در زمینه روان‌شناسی خواهدخرید. دشواری‌های پیش‌ روی آمازون در ارائه پیشنهادهایش، متفاوت از چالش‌هایی است که موتورهای جست‌وجو با آن‌ها مواجهند. موتورهای جست‌وجو باید با اطلاعات هستی‌شناختی انگشت‌شمار کار کنند، چون فهمیده‌ایم بسیار دشوار است که روی وب بر‌اساس یک هستی‌شناسی کار کرد. آمازون یک هستی‌شناسی منظم و دسته‌بندی‌شده دارد، بنابراین باید که دریابد که رسته‌های گوناگون درون آن هستی‌شناسی چگونه به هم مربوط هستند‌ و به این شکل داده‌های بیشتری درباره هستی‌شناخت موجود به‌دست آورد. برای کامپیوتر، همه این‌ها در‌نهایت کار کردن با نمادها است، اما سرشت داده‌ها در این دو مورد بسیار متفاوت از هم است.
آمازون همچنان مشکل‌هایی دارد. جدا از مبهم بودن برخی رسته‌ها ممکن است به سادگی دشواری‌هایی در وارد کردن فراداده وجود داشته‌باشد. آمازون ادعا می‌کند که در اثر استفاده از عنوان گزارش به جای فهرست نویسندگان، چندین گزارش واردات و صادرات گوشت را سه‌گانه Chilled the Fresh، Frozen Horse و Ass Meat Research Group نوشته‌اند! این‌گونه اشتباه‌ها را باید دستی اصلاح کرد، چرا‌که راه آسانی برای تشخیص دادن‌شان توسط کامپیوتر وجود ندارد (چگونه کامپیوتر می‌تواند چنین اشتباهی را بیابد؟ بسیاری از نام‌های انسانی، حاوی واژه‌های عادی زبان هستند‌ و نیز، بسیاری از گروه‌های پژوهشی یا محصول‌ها نیز نام‌های عجیب و غریب دارند). داشتن فراداده صریح موجب کاهش شمار چنین خطاهایی می‌شود که انسان‌ها باید بیابند و اصلاح کنند.
آمازون شیفته آن است که بیشتر بداند. اگر سابقه پزشکی من را داشتند، می‌توانستند قرص‌هایی برای سردردهایم توصیه کنند. اگر از محتوای کتاب‌خانه‌ام خبر داشتند، دیگر کتاب‌هایی که جایی دیگر خریده‌ام را به من پیشنهاد نمی‌کردند. اگر می‌دانستند دارم این مقاله را می‌نویسم، کتاب‌هایی درباره آینده کامپیوترها به من پیشنهاد می‌کردند!

soheil چهارشنبه 7 فروردین‌ماه سال 1392 ساعت 17:08