Onlangs waren we met Wikipodium te gast bij Microsoft voor een presentatie en discussie met o.a. de Product Manger SharePoint uit Redmond, over de nieuwe Social Computing mogelijkheden van SharePoint 2010.
Tijdens de discussie kwam nogmaals het belang van een goede governance structuur naar boven om zo planmatig mogelijk de verschillende sociale toepassingen voor de verschillende doelgroepen mogelijk te maken. (Zie hierover mijn blogartikel over governance).
Toen kwam de interessante vraag: wat doe je als zelfs je (SharePoint) omgeving chaotisch gegroeid is en je heel moeilijk kan weten wat waar welke werkruimtes en documentbibliotheken staan? En/of wanneer er veel chaotische netwerkshares zijn met oerwouden van folderbomen? En/of een dito Intranet?
Als je van nul start is het enige wat je direct kan toepassen een zoekmotor. Een goede zoekmotor kan niet alleen op het Intranet zoeken, maar ook in andere bronnen zoals netwerkshares. Voor de gebruiker werkt die dan zoals Google of Bing: je tikt woorden in die je vraag weergeven, en je verwacht dat relevante teksten over dat onderwerp naar boven komen. Maar zullen de meest pertinente dan ook naar boven komen? Zomaar de strategie van de internetzoekmachines toepassen op interne omgevingen werkt minder goed.
Interne omgevingen zijn immers gekenmerkt door een heel grote hoeveelheid documenten in formaten zoals office en PDF. Dit is in tegenstelling tot het Internet waar er veel meer webpagina’s zijn (in html e.d.), en met veel hyperlinks tussen de pagina’s. Zoekstrategieën zoals door Google en Bing ranken een pagina niet alleen op basis van de correspondentie van de zoekterm en de inhoud van het document, maar ook op basis van het aantal hyperlinks van en naar pagina’s en sites met gelijkaardige inhoud.
Een goede interne zoekmotor gebruikt voor zijn ranking andere contextinformatie dan hyperlinks. Deze kunnen in het document zelf zitten als bvb. een zoekterm ook in titels van documenten of hoofdstukken staat. Of ze kunnen in de naam van de folder staan op de netwerkshare.
Maar dat belet niet dat je nog steeds heel veel documenten kan terugkrijgen. Het is dan ook belangrijk dat een gebruiker zijn zoekopdracht kan verfijnen. De suggesties voor mogelijke verfijningen staan typisch in een paneel:
In dit voorbeeld zijn de suggesties links automatisch gegenereerd door de search engine, in dit geval de Internet zoekmotor Yippy. Bemerk dus het grote potentieel om in een chaotische hoop toch iets te vinden.
Hoe komt zo'n search engine aan die suggesties? In bovenstaand voorbeeld gebeurt dit door statistische analyse van termen. Maar indien de gebruikers in je organisatie zelf sleutelwoorden kunnen toekennen (taggen), dan zijn die sleutelwoorden prioritaire kandidaten voor suggesties.
(Klik op de figuur om de afbeelding groter te zien)
In moderne systemen zoals SharePoint 2010 krijgen de gebruikers trouwens suggesties voor sleutelwoorden op basis van de tags die collega's en mensen uit hun persoonlijk netwerk gebruiken. De goede gewoontes van de individuen maken dus de zoekmotor als maar intelligenter.
Het geheel van die door de gebruikers gekozen tags heet een folksonomy. Men kan evenwel nog verder gaan. Men kan immers centraal een als boom gestructureerde taxonomy maken met de typische begrippen die in een organisatie voorkomen. De zoekmotor gaat dan de documenten automatisch in de passende categorie plaatsen, zoals in onderstaand voorbeeld.
Taxonomy en Folksonomy vullen elkaar dus aan. In deze aanpak is een taxonomie dus een van de eerste investeringen in KM, na de zoekmotor.
Het verfijningspaneel kan uiteraard ook gestructureerde informatie bevatten, zoals in onderstaand voorbeeld:
Bemerk ook de bronkeuze: SharePoint sites, stukken intranet, stukken van netwerkshares...
De gestructureerde gegevens kunnen ook uit databanken komen, zoals de databank met klantengegevens in het CRM systeem.
De zoekmotor is op die manier geen vaste module, maar een applicatie die je ontwikkelt. Hieronder staat een interessante video over "search driven applications"
Je kan dus in een chaotische omgeving starten door een optimale zoekmotor te maken. In een volgende fase kan dan de onderliggende chaos zelf aangepakt worden. Een belangrijke taak hierbij bestaat er in om inhoudelijke eigenaren aan te duiden van elk stukje chaos, en hen vragen het uit te kuisen of te archiveren. Er zitten wellicht veel klad documenten, tussentijdse versies e.d. overal. Als er al een aanduiding kan gemaakt worden of een document kwalitatief hoogstaande of niet is, dan kan de zoekmotor alweer pertinentere antwoorden geven. In een volgende fase kan dan per onderdeel, zoals folders op een netwerkshare, gezien worden of het interessant is om deze naar meer gestructureerde omgeving om te zetten zoals een SharePoint bibliotheek met metadata.
Reacties