בזמנו כתבתי בבלוג על מנוע החיפוש הסמנטי Hakia. Hakia משתמש בשיטה המיוחדת לו לאחסון וניתוח סמנטי של מסמכים אלו לצורך אחזורם.
מנוע החיפוש HAKIA מחפש בסגמנטים שונים: ווב, חדשות, בלוגים וידאו תמונות ועוד . בחלק מהסגמנטים הוא משתמש בשיטה שנקראת QDEX – Query Detection and Extraction ואשר מחליפה את השיטה המקובלת ליצירת אינדקס. על פי השיטה המקובלת ליצירת אינדקס שמכונה קובץ מהופך –inverted file – האינדקס כולל את המונחים המופיעים בטקסט, ומצביעים אל מונחים אלה מהווים בתהליך אחזור המידע שערי גישה למסמכים. אם נשתמש בשיטת הקובץ המהופך גם להוספת קשרים סמנטיים ייווצר מבנה שיכביד מאוד על הביצועים. בשיטה החדשה של מנוע החיפוש Hakia, לעומת זאת, שערי הגישה לדפי ה-Web אינם מצביעים למלים אלא לשאילתות. המנוע מנתח באמצעות אלגוריתם מתוחכם את כל השאילתות האפשריות בדפי ה- Web והשאילתות מהוות שערי גישה לדפי ה- Web. באופן זה בעת אחזור המידע המנוע עובד על סטים קטנים יחסית של דפי Web ורק עליהם הוא מבצע את הניתוח הסמנטי. בכך נפתרת בעיית המשאבים הרבים שנדרשים לביצוע ניתוח סמנטי על מספר רב של דפים. על פי התיעוד באתר ביצוע הניתוח הסמנטי ודירוג התוצאות מתבצע באמצעות אלגוריתם מתוחכם SemanticRank שעושה שימוש גם באונטולוגיות.
טכנולוגיה סמנטית זו מיושמת על מאגר המידע הביורפואי Pubmed הולידה את מנוע החיפוש New Pubmed search. מנוע זה הוא מנוע חיפוש חופשי וכפי שנכתב באתר מחפש בלמעלה מ- 20 מיליון תקצירים של המאגר הרפואי PUBMED ובזכות הטכנולוגיות הסמנטיות בהן הוא משתמש אפשר לקבל תשובות רלוונטיות יותר לשאילתות שמבקשות לתת מענה על קשרים בין משתנים שונים. דוגמאות אפשר למצוא באתר.
בדוגמאות אלו אפשר לקבל גם את התוצאות במנוע זה בהשוואה לאותן שאילתות ב- Pubmed .
הטכנולוגיה בה משתמש המנוע ומכאן מאפייניו הייחודיים שלו כגון: טיפול בוריאציות מורפולוגיות, במילים נרדפות, טיפול בהכללה בצורה נכונה, הבנת המשמעות של המילים, טיפול נכון בשאילתות בשפה טבעית ואפשרות להזנת השאילתה באופן חופשי ללא צורך באופרטורים מיוחדים הם אחראים על פי מפתחי המנוע להבדלים.
יישום נוסף שמוזכר באתר של Hakia הוא MoodTRADE .- כלי להשקעות שמאפשר למשתמשיו לעקוב בזמן אמת אחרי חדשות של חברות. שלא כמו New Pubmed search יישום זה אינו חופשי.