Het ding met de duplicate entries is dan nog niet eens mijn grootste bekommernis. Want, grof bekeken, kan zo’n link aanzien als een identifier (of key) natuurlijk. (Het hóeft niet altijd een nummer te zijn.)
Blijven we even bij Johann Sebastian Bach, dan is de unique identifier de string (urlencoded), zoals hij aan het einde van een URL kan worden toegevoegd om tot de desbetreffende pagina-met-meer-informatie te komen. In casu: Johann_Sebastian_Bach
(cfr). Vreselijk lang, en de mensen kennen ook niet altijd de juiste schrijfwijze, dus maken we een link van een verkorte versie (Bach
) naar de lange (Johann_Sebastian_Bach
).
Twee problemen hierbij:
- Er kan meer dan één Bach zijn: Carl Philipp Emanuel Bach bijvoorbeeld. In dat geval kunnen we de korte link
- hetzij nog steeds naar
Johann_Sebastian_Bach
laten doorverwijzen, en bovenaan de pagina een waarschuwing aanbrengen: opgelet, er zijn ook andere Bachs (cfr)
- hetzij de korte link meteen laten doorverwijzen naar de disambiguation pagina, waar de ganse familie Bach en mogelijks andere Bachs worden opgesomd.
Hierbij blijven we het systeem van de unique identifier gebruiken, het ‘probleem’ treedt enkel op bij de verkorte versies.
- er kan echter ook meer dan één Johann Sebastian Bach zijn, maar ook in dat geval kunnen de bovenstaande regels worden toegepast. De unique identifier dient dan wel te worden aangepast.
Groot nadeel bij het Wiki-principe is dan weer dat ik op het eerste gezicht geen manier vindt om
- De informatie automatisch te laten invullen vanuit allerlei on-line bronnen.
- Een lijst te trekken van alle informatie die zich in mijn Wiki bevindt, of van bvb alle CDs of boeken die ik van of over een bepaald persoon heb.
Zeer groot voordeel aan de Wiki software is dan weer wel het gemak waarmee een nieuwe entry kan worden aangemaakt, de version control, de interface, de mogelijkheid tot serendipiteit, de interlinking, etc.
Een andere manier van denken vinden we dan terug bij de Internet Movie Database (imdb). Zoeken op ‘bach‘ brengt ook Johann Sebastian Bach op de eerste rij terug, waarbij de unique identifier een meer traditionele combinatie van letters en cijfers is. nm0001925
in ons geval, waarbij de nm
staat voor name (bij titels is dat tt
).
De pagina over Johann Sebastian Bach levert ons de relevante informatie over die persoon, inclusief links. Veel relevanter (voor mijn doel) allemaal, maar waarschijnlijk ook moeilijker te onderhouden. Alle informatie op die pagina is on-the-fly gegenereerd (met caching etc.), waardoor zowel de data, als de links eenvoudig site-wide aan te passen zijn. (Bij Wikipedia dienen de links manueel te worden aangepast/bijgehouden.)
Goh, ik zit eigenlijk gewoon rond de pot te draaien. Eigenlijk ben ik gewoon op zoek naar een combinatie van del.icio.us, het ter ziele gegane Singlefile (link werkt zelfs niet meer), IMDB, Amazon, en Wikipedia.
En nog eigenlijker wens ik een soort van shared of community cataloguing software, gevoed door de gebruikers, die hun data automatisch kunnen laten invullen aan de hand van UPCs, EANs, ISBNs en what have you. Waar op allerlei manieren korte inhoud, reviews, etc. op eenvoudige ende gebruiksvriendelijke manier kunnen worden geconsulteerd én ingegeven/gewijzigd. MyBooks, MyMovies, MyCDs, MyEverything.
Al zou ik al meteen geld neertellen voor een stuk software dat die functionaliteit voor mij alleen biedt. Het gaat er bij mij echt niet in dat daar nog nietmand mee bezig is. Als ik zelf zou kunnen programmeren, ik zou geen moment twijfelen: de Amazon API, een interface naar IMDB en Nationale Bibliotheken (zoals dat ook in collectorz zit). Araarrghhh stapelzot word ik ervan.
Misschien een beetje Delicious Library, maar dan on-line, beter (beter werkend), internationaal, en in community-enabled versie.
Maar nu ben ik wel heel erg van het onderwerp afgeweken.