Zijn tweets archiefstukken?
Ik denk het wel. Ze hoeven misschien niet allemaal eeuwig bewaard te blijven, maar de berichten van
ministers,
gedeputeerden,
raadsleden,
Tweede Kamerleden en
ambtenaren geven een beeld van de manier waarop de overheid rond deze tijd communiceerde. En, de verzenders kunnen aangesproken worden op uitlatingen die zij via Twitter gedaan hebben. (Zie bijvoorbeeld de
discussie die ontstond naar aanleiding van de
foto uit de Ministerraad die Verhagen maakte. Of de
consternatie die ontstond naar aanleiding van de niet zo diplomatieke opmerkingen van Boekestijn over Chinezen.)

Stel nu dat je de tweets van gedeputeerde Hoes of minister Verhagen wil archiveren, hoe doe je dat dan? En welke problemen moeten nog opgelost worden?
Laat ik voor het gemak even uitgaan van mijn eigen tweets.
Om te beginnen zijn er enkele websites / programmaatjes die je in staat stellen om je eigen tweets te bewaren.
Tweetake en
Tweetdumpr zijn het simpelst.
Met Tweetake kun je periodiek een export maken van al je eigen tweets, je ontvangen direct messages (vreemd genoeg niet je verzonden berichten), je friends (de mensen die jij volgt), je followers (de mensen die jou volgen) en je ‘favoriete’ tweets. Nadat je je Twitternaam en wachtwoord hebt ingevuld, maakt Tweetake een simpel csv-bestand, waarin de tweets zijn aangevuld met allerlei metadata: naam, schermnaam, id, avatar, website, datum. (In het hierbij gevoegde voorbeeldbestandje heb ik de direct-messages overigens handmatig verwijderd.)
Nadeel is echter dat je met Tweetake maximaal de 1.000 meest recente berichten kunt opslaan. Oudere berichten neemt-ie niet mee.
Tweetdumpr werkt ongeveer hetzelfde, al heb je hierbij genoeg aan een Twitternaam en hoef je het wachtwoord niet te kennen. Je kunt hiermee dus ook andermans tweets integraal downloaden. Helaas is Tweetdumpr in zoverre beperkt, dat het tekstbestandje alleen tweets, zonder nadere metadata, bevat. Het lijkt er trouwens op dat ook Tweetdumpr niet alle berichtjes download. De ‘dump’ van MaximeVerhagen in het voorbeeld leverde 3230 berichten, terwijl Twitter er op hetzelfde moment 3735 telt.
Als je het dus regelmatig doet, lijken deze applicaties voor het bewaren van ‘eigen’ tweets een mooie oplossing, aangezien platte tekstbestandjes redelijk makkelijk te archiveren zijn. In verband met de meegeleverde metadata heb ik een voorkeur voor Tweetake.
Maar, zijn we er nu al? Je hebt nu toch alleen de inhoud? Moeten we niet ook nog nadenken over de context van de tweets, over structuur en vorm?
Om met dat laatste te beginnen. Ik denk dat je gerust kunt stellen dat de vorm zo divers kan zijn, dat je die over het hoofd kunt zien. Als ik naar mezelf kijk, ik lees en schrijf tweets op dit moment via vier verschillende applicaties:
Twittergadget,
Twitter.com,
Twhirl en
Tweetdeck. Alle interfaces zien er anders uit en op mijn (toekomstige) Blackberry zal het er weer anders uitzien. Daarom stel ik me tevreden met enkel de inhoud van de tweets.
(Overigens, het zou wel mooi zijn als Tweetake ook het medium waarmee de tweet verzonden is, zou weergeven, zoals in ieder geval Twitter.com en Twhirl dat ook doen).
Structuur en context vind ik spannender. Met Tweetake kan ik wel opslaan wie ik allemaal volg, maar hun berichten kan ik niet downloaden. Ik kan de ‘timeline’ zoals ik die in Twittergadget of op Twitter.com kan zien, niet bewaren. Terwijl dit wel relevant kan zijn voor de berichten die ik verstuur. Je ziet in ‘mijn’ archief wel dat ik iemand een antwoord stuur of een vraag stel, maar de berichten daar om heen (vraag of antwoord) zijn er niet. Alsof je in je archief alleen je eigen verzonden brieven bewaart.
Is dat simpel op te lossen?
Misschien zou je met de beschikbare rss-feed de timeline kunnen herstellen, maar de feed lijkt maar heel korte tijd terug te gaan. Twittersearch is ook geen oplossing voor de replies, aangezien de zoekresultaten beperkt zijn tot de laatste paar maanden. Kijk maar, dit
bericht is met
Twittersearch niet te vinden.
(
Twickie leek veelbelovend, maar volgens mij kan ik hier alleen reacties op individuele tweets zoeken. Dat is een beetje omslachtig.)
Misschien is het mogelijk om met de
Twitter-api iets te doen. Deze wordt waarschijnlijk ook gebruikt door Tweetake, maar ik heb nog niet echt iets gevonden. Vooralsnog acht ik mezelf ook niet techneut genoeg om dit op te lossen.
Een ander context-probleem leveren de tweets die bijvoorbeeld tijdens een conferentie verstuurd worden. Eigenlijk zijn deze alleen te begrijpen als je tegelijkertijd de betreffende presentaties kunt zien. Het synchroon laten lopen van tweets en opgenomen presentaties, lijkt me dan nog een hele uitdaging.
En dan is er ook nog het ‘normale’ probleem van het archiveren van webpagina’s: wat doe je met de links? Dit wordt bij het archiveren van tweets nog iets ingewikkelder, omdat in de meeste gevallen de url’s verkort worden door diensten als
is.gd,
tinyurl.com of
bit.ly. Dit betekent dat je om in de toekomst een link te kunnen volgen, ook het algoritme moet kennen waar de url mee is versleuteld.
Tenslotte ga ik hier ook voorbij aan eventuele juridische bezwaren (bijvoorbeeld de Auteurswet) tegen het archiveren van andermans tweets.
Kortom, er zijn al een paar, praktische, simpele manieren om een deel van het Twitterarchief van Verhagen en Hoes te archiveren. Voor een volledig archief moet nog wat werk verzet worden.
Is er iemand die deze uitdaging aanneemt? Ik stel mijn account wel beschikbaar voor tests.
Met dank aan
@mopennock’s
Archiving twitter.