شرکت هیولتپکارد (موسوم به اچ پی) که از شناختهشدهترین و بزرگترین شرکتهای جهان در حوزه تجهیزات رایانهای و فناوری اطلاعات است، توسط دو نفر از دانشآموختگان دانشگاه استنفورد به نامهای دیوید پکارد و ویلیام ردینگتون هیولت با سرمایه ابتدایی ۵۳۸ دلار پایهگذاری شد. تلاش این دو نفر موجب شد که سرمایه شرکت کوچک آنها پس از حدود هفتاد سال به ۹۰ میلیارد دلار برسد. این شرکت در حال حاضر در بیش از ۱۶۰ کشور جهان فعالیت میکند.
چاپگر یکی از مهمترین محصولات اچپی است و از جمله چالشهایی که این شرکت در سالهای اخیر در ارتباط با این محصول با آن روبرو شد، چاپ صفحات اینترنتی بود. اغلب وبسایتها حاوی فیلم یا تصاویر کوچک و بزرگی بودند که کاربران نیازی به چاپ آنها نداشتند، اما نمیتوانستند از چاپ آنها در حین چاپ متن صفحات جلوگیری کنند و در نتیجه سالانه تعداد زیادی کاغذ سفید هدر میرفت.
هرچند برخی نرمافزارهای دادهکاوی شرکت اچ پی عملکرد قابل قبولی در شناسایی و استخراج متن صفحات اینترنتی داشت، اما اچ پی به دنبال الگوریتمی بود که بتواند به سرعت تمام محتوای چندرسانهای صفحات اینترنتی که خارج از متن اصلی بود را شناسایی و از چاپ آنها جلوگیری نماید تا بدین ترتیب مشتریان تجربه بهتری از کار با چاپگرهای اچپی داشته باشند و در مصرف کاغذ نیز صرفهجویی کنند.
بنابراین در سال 2009 شرکت اچ پی چالشی را برگزار کرد تا به کمک مخترعان، پژوهشگران و علاقمندان در آمریکا و سایر کشورهای جهان، با سرعت بیشتر، هزینه و ریسک کمتر بر این مشکل غلبه کند. موضوع این چالش توسعه الگوریتمی بود که با دقت نزدیک به 99 درصد، از هر صفحه اینترنتی با هر زبانی که باشد، تنها محتوای مورد نظر کاربر را چاپ نماید. بنابراین همه الگوریتمهای دریافتی از سوی شرکتکنندگان در چالش، روی مجموعهای از صفحات اینترنتی از پیش تعیین شده مورد آزمایش قرار میگرفت.
سرانجام یک گروه 3 نفره تایلندی که روی آنالیز تصاویر اینترنتی کار کرده بودند موفق به ارائه الگوریتمی شدند که به سرعت قادر به شناسایی محتوای غیرمتنی و فرعی صفحات اینترنتی با دقت 94.08 درصد بود. هرچند این دقت کمتر از آن چیزی بود که اچپی انتظار داشت، اما توجه اچ پی را به خود جلب کرد. اعضای این گروه پس از خاتمه چالش به تدریج به بهبود عملکرد الگوریتم خود پرداختند.