URLs, archieven en informatie

Zoals gisteren vermeld, was de URL voor een post in dit weblog samengesteld volgens de methode

http://blog.volume12.net/[JAAR]/[MAAND]/[POST ID].htm

Logisch, en gemakkelijk om terug te vinden, zou u kunnen stellen, al vraag ik mij af welke meerwaarde de jaar- en maandaanduiding in de URL biedt. Het kan inderdaad interessant zijn om alle postje van een bepaald jaar, een bepaalde maand of zelfs dag gegroepeerd terug te vinden, maar die datum noodzakelijk maken om een URL aan te maken, vooral wanneer de eigenlijke identificatie van een post numerisch is, lijkt me overkill.

In alle eerlijkheid, was het vooral de manier waarop MT (mijn vorige blogsysteem) de posten publiceerde dat mij ertoe aanzette een dergelijke structuur te gebruiken. MT publiceert immers de postjes als ‘echte’ bestanden, op de webserver. WP publiceert eigenlijk niks, maar haalt alle informatie uit een database, afgeleid van de samenstelling van de URL. Ergo, een lijst van 1500+ bestanden in de root directory bij MT is een beetje onoverzichtelijk (scroll daar maar eens door), maar bij WP stelt het probleem van een dergelijke hoeveelheid bestanden zich eenvoudig niet.

Een URL waarin de titel van de post wordt vermeld, genre

http://blog.volume12.net/2005/10/boeken-200509.htm

lijkt mij niet voordeliger dan een volledig numerische URL. De ganse opzet achter het gebruik van dergelijke URLs is om het de bezoeker gemakkelijker te maken informatie terug te vinden. Ik zie evenwel niet in wat het voordeel zou zijn van een URL zoals dit

http://gent.blogt.be/2005/12/05/hier-spreekt-men-gents-6-de-tussenstand

te bieden heeft boven een URL zoals dit

http://blog.volume12.net/2452.htm

Integendeel, de tweede (numerische) URL lijkt mij korter om ergens op te schrijven, of te onthouden. Een wijziging naar

http://gent.blogt.be/hier-spreekt-men-gents-6-de-tussenstand

maakt de zaak er niet noodzakelijk eenvoudiger op.

Het probleem zit hem in de lengte van de URL, de samenstelling van de woordgroep (aaneen geschreven, met ‘-‘, ‘_’ of nog iets anders), en de uniciteit van de identifier. In dat laatste geval geldt: hoe langer de URL, hoe kleiner het risico, maar wat te doen indien we twee of meer postjes met als titel ‘boekenlijst’ hebben? In WP levert dat de volgende URLs op

http://blog.bolume12.net/boekenlijst

http://blog.bolume12.net/boekenlijst-1

…waarmee we opnieuw met nutteloze complexiteit geconfronteerd worden.

Geheel anders wordt dat in het geval van een aantal min of meer standaard zaken, zoals ‘info’, ‘archives’, etc., waarvoor het geheel logisch is de naam in de URL te verwerken.

http://blog.volume12.net/info/

Maar hier is duidelijk sprake van een onderscheid tussen permanente informatie en wisselende content.

Terug naar die wisselende content; belangrijker dan de URL is de manier om de informatie te ontsluiten, de mogelijkheid die aan de bezoeker wordt gegeven om informatie terug te vinden. Drie mogelijkheden worden standaard op de meeste weblogs aangeboden: (1) de search box, (2) de categorieën, en (3) de chronologische archivering. Van deze drie is de search box de meest doeltreffende (op voorwaarde dat die goed werd geïmplementeerd), zijn de categorieën vooral handig voor een onderverdeling van de interesses (bvb computers & internet vs klassieke muziek), en is de chronologische archivering eigenlijk de minst interessante voor een weblog. (Tenzij het over een evenement-gedreven weblog gaat natuurlijk.)

Veel interessanter is tegenwoordig het gebruik van tags (keywords), die vrij aan een post kunnen worden toegekend. Klikt men op zo’n tag, dan krijgt men een lijst van alle entries die met dat keyword werden geassocieerd. Wordt de lijst te lang, dan kan men –bij een goede implementatie van het systeem– de selectie verfijnen door een tweede tag toe te voegen die relevant is voor het gezochte. Helaas heb ik voor WP nog geen dergelijke implementatie gevonden (tips zijn uiterst welkom).

Vandaar het ondergeschikte belang van ‘betekenisvolle’ URLs voor weblogs. Gezien de hoeveelheid entries op een webblog, en daaraan toegevoegd de manier waarop de meeste weblog archieven worden samengesteld, is niet de URL maar wel de ontsluiting van de archieven van primordiaal belang. De eerste (voornamelijk theoretische) stappen in de goede richting zijn reeds gezet, maar het is voorlopig nog wachten op een adequate implementatie.

3 gedachtes over “URLs, archieven en informatie”

Michel Vuijlsteke schreef:

7 december 2005 om 17:22

Gesproken zoals een echte mens-voor-wie-het-allemaal-niet-meer-hoeft! Grootste (enige?) voordeel van die URL’s met woorden en niet meteen cijfers is SEO natuurlijk.
Pietel schreef:

7 december 2005 om 19:04

Wooow. Langste post ever!
Huug schreef:

7 december 2005 om 19:43

Ik begin een beetje te snappen waar je zo dikwijls migraine van krijgt.

Reacties zijn gesloten.