Vorige week was ik de gehele dag aanwezig op de laatste dag van de SIGIR’07 conferentie die was omgedoopt tot ‘Industry Event‘ en volledig in het teken stond van Search.

Dit vierde verslag behandelt de middagsessie over Novel Search Applications, ofwel zoekapplicaties en zoektechnologie. Ga voor een volledig overzicht van de sessies en bijbehorende verslagen naar het artikel Congres: SIGIR’07 – Industry Event (Search).

Information Access and the User Experience

– 14.00 – 14.20
– Daniel Tunkelang (Endeca)

Endeca is in 1999 opgestart en heeft inmiddels meer dan 450 medewerkers. Endeca verkoopt zoektechnologie wat ze ‘information access’ noemen.

Information retrieval is gecentreerd rond een systeem. Een gebruiker voert een (vaak onduidelijke, niet-specifieke) zoekopdracht uit en laat het systeem vervolgens het werk doen.

‘Information access’ is gecentreerd rond de gebruiker. In plaats van het optimaliseren van de relevantie, gaat information access uit van het oplossen van een communicatieprobleem.

Om dit te bereiken, wordt veel gewerkt met ‘query refinement’: naast de zoekresultaten worden zaken als clusters van zoekwoorden, gerelateerde termen en andere verfijningmethodieken ingezet.

Endeca probeert zoekresultaten terug te geven die bestaan uit keuzes voor de gebruiker. Omdat veel zoekopdrachten dubbelzinnig zijn, probeert Endeca niet een zo relevant mogelijk antwoord terug te geven, maar helpen ze de gebruiker bij hun zoektocht door een dialoog aan te gaan.

De focus ligt daarmee bij Endeca op de derde ‘search-regel’ van William Chang (facetten zijn belangrijker dan relaties), zoals staat beschreven in de presentatie van Baidu in de Consumer Search sessie.

Result Relevancy beyond Linguistics in E-Commerce Search

– 14.20 – 14.40
– Ronny Roeller (Fredhopper)

De tweede spreker vertegenwoordigd Fredhopper, een bedrijf wat zoektechnologie levert voor ecommerce websites. Ze zijn gevestigd in Amsterdam en hebben dus veel Nederlandse klanten, zoals Speurders.nl, Bruna en Albert, maar ook klanten als Thomas Cook, Otto, etc.

Bij ecommerce gaat het om het sturen op conversie, meestal een aankoop van een product. De zoekresultaten die goed converteren worden daarom hoger gerangschikt.

Omdat de databases van ecommerce websites eindig zijn en veel kleiner zijn dan de index van een zoekmachine, is er meer ruimte om meer meta data (beschrijvende informatie) toe te voegen aan de producten. Dat levert gestructureerde data op wat goed meetbaar is.

Uitdagingen

Fredhopper vindt enkele uitdagingen in het gebruikersvriendelijk houden van de navigatie en de toename van data en variatie van producten.

Na uitgebreid usability onderzoek heeft Fredhopper twee problemen gevonden, namelijk 1) dat de terminologie van productaanbieders verschilt met de gebruikte zoekwoorden van de eindgebruikers en 2) dat één rangschikking van de zoekresultaten niet voldoende is om verschillende gebruikersgroepen tevreden te stellen. Mede daarom wordt het klikgedrag van gebruikers ook onderzocht in de ‘clickstream’ analyse.

Clickstream (klikgedrag) analyse

Naast ‘product classification’ middels meta data analyseert Fredhopper ook de ‘clickstream’ patronen (het klikgedrag) van gebruikers.

De winst voor ecommerce websites zit in de long tail, maar daar zit ook het probleem van Information Retrieval. In de specifieke long tail zoekopdrachten is er beperkte historische data omdat de zoekopdrachten niet veel voorkomen. Verder is het van belang dat je de juiste mix hebt van commerciële productdata en clickstream analyse.

Ecommerce heeft echter niet alle problemen van Information Retrieval, want de informatie hoeft niet uit een ongestructureerde index te worden gehaald, omdat het een beperkte database is. Dat laat meer ruimte om de data te structureren.

State of the Art in Mobile Search

– 14.40 – 15.00
– Jochen Leidner (Linguit Ltd.)

Linguit is een ‘startup’ uit Schotland, tevens verbonden aan een universiteit aldaar, die zoektechnologie voor mobiele apparaten maakt.

Jochen Leidner wijst ‘4 screens of life’ aan, te weten de desktop (computer), mobiel (telefoon, PDA), Televisie en ‘In-car’ (TomTom).

Mensen reizen en mensen hebben mobiele apparaten bij zich. Mensen hebben verschillende behoeften afhankelijk van waar je bent en wat je doet. Op reis heb je minder tijd, budget, geduld en accu om in je informatiebehoefte te voorzien.

Er zijn verschillende spelers actief op mobile search, waarvan Google en Yahoo! bekende spelers zijn.

De presentatie had helaas een te lange introductie, waardoor er nauwelijks over de zoektechnologie van Linguit is gesproken. De volgende conclusie is te trekken uit het verhaal:

Er zijn veel specifieke zoekdiensten (weer, verkeer, etc.), maar er zijn echter voldoende beperkingen, met name fysiek en technisch, die de doorbraak van mobile search tegenhoudt. De enorme penetratie van mobiele apparaten biedt veel kansen, maar de vele belanghebbenden, van mobiele operators tot zoekmachines, maken het lastig om succesvol te zijn.

Ga voor een volledig overzicht van de sessies en bijbehorende verslagen naar het artikel Congres: SIGIR’07 – Industry Event (Search).