הווב מכיל דפים רבים עם מידע מתעדכן ומתחדש – ידיעות חדשותיות, פוסטים בבלוגים וציוצים. לעבד את המידע ידנית היא משימה בלתי אפשרית. מנועי חיפוש מסוגלים לאתר פריטי מידע של מידע אבל מותירים מאחור את התמונה השלמה. Extractiv – שירות לחילוץ מידע מטקסט יכול לסייע במשימה.
Extractiv הוא שירות שהופך באופן אוטומטי טקסט לא מובנה לטקסט סמנטי מובנה. משלב זחלן שסורק דפי ווב על פי בקשה או הגדרת מלות מפתח, ויכולת של ניתוח בשפה טבעית. מזהה זהויות וקשרים ביניהם.
Extractiv מאפשר למשתמש להגדיר מה הוא רוצה לחלץ מהטקסט כך למשל אם מגדירים לו עיר הוא יחלץ את כל הערים , כמו כן הוא מאפשר למשתמש להגדיר באיזה פורמט הוא רוצה לקבל את התוצאות. השירות הוא בתשלום. מדי פעם ג'וב של עד 1000 URL אפשר לקבל חינם לאחר הרשמה חינמית לפורטל.
במהלך תהליך הגדרת המשימה על ידי המשתמש – המשתמש בוחר נושא מתוך רשימת נושאים כגון רפואה, מחשבים, וזהויות שמוצעות למשתמש לבחירה בהתאם לתחום שבחר – כך למשל ברפואה מוצעות זהויות כמו דוקטור, תרופה, מחלה, בתי חולים וכו' , במחשבים – אלגוריתם שפת תכנות ועוד..
המשתמש בוחר קשרים אותם הוא רוצה שהכלי ינתח כמו גיל, מספר טלפון, דת, שפה. אפשר להזין מלות מפתח והיישום מחפש אתרים בהתאם. אפשר לתת רשימת אתרים ממנה יתחיל את הסריקה , אפשר לבקש שיסרוק את כל הקישורים או להתמקד בדומיינים מסוימים , להגדיר את עומק הסריקה, מספר URL שיסרוק, פילטרים , ובאיזה פורמט רוצים לקבל את התוצאות – – JSON, XML, RDF. בעתיד מבטיחים גם . sentiment analysis
שירות כזה יכול להיות יעיל לקבלת מידע על אדם מסוים או חברה מסוימת וגם על נושא מסוים והוא מהווה חזון לעתיד..