Archive for the ‘openminds’ Category

harde noten

Wednesday, April 19th, 2006

Door de groei van Openminds, en het verstrijken van de tijd in het algemeen, moeten af en toe harde noten gekraakt worden op kantoor…

Eentje ervan is de volgende: reeds enkele weken zijn we in overleg met Netlash over de nieuwe site. Er moet eens nieuwe structuur komen, andere tekst… en een nieuw design. Dirk is met verschillende ideeën komen opdagen, en nu is het aan ons om er het goeie uit te kiezen. We zullen deze allemaal eens printen, en rondhangen in het kantoor, zodat we dagelijks erop zitten te kijken, en zo zien wat er afstoot en wat er aantrekt. Er zitten echt goeie ideeën in…

Man, dit is moeilijk, en je weet niet als je keuze de goeie is… een sprong in het duister!

halve werkdag

Monday, April 17th, 2006

Beetje vreemd, zo een paasmaandag.

Wat klusjes in en om het huis aan het doen, en af en toe eens naar de PC lopen om te kijken als er geen dringende mail; daarnet wat tuinkruiden en potgrond strategisch gemengd, straks nog even snel heen en weer naar InterXion met een server voor een klant, dan misschien nog mijn gras afrijden. Daarna misschien een stukje programmeren voor het domeinsysteem, of misschien wel de afwas doen… Zeer verwarrend allemaal. Vanavond dan nog eens aan de kook slaan (scampis met verse pasta. Njamie!), en misschien nog wat denken over enkele strategische zaken die voor Openminds moeten gebeuren… Mijn vriendin is ook in de weer met de voorbereidingen voor een weekje stage, en met een half oog de wasmachine in de gaten aan het houden.

Zou dit nu part-time werken zijn? De kat vindt het allesinds superleuk, al die beweging.

cash

Friday, April 14th, 2006

Wat is dat toch met de klanten de dag van vandaag? Net kreeg ik de derde vraag in evenveel dagen als er andere betalingmethodes zijn dan een gewone overschrijving.

In de business van het internet, met alle webbanking mogelijkheden, vragen mensen als het mogelijk is om cash te betalen. De laatste keer dat ik checkte, waren we geen supermarkt. De bedragen zijn ook niet zo belachelijk laag dat een overschrijving meer kost. Een van de drie was zelf een bedrag van 4 cijfers, en had reeds een factuur ontvangen.

Voor de goede orde, we ontvangen dus geen cash geld.

oe-oe = ah-ha

Thursday, April 13th, 2006

Vandaag nog maar eens tegen het eeuwige charset probleem aangelopen. Sinds enige tijd staat de site van de Culture Club op een server in ons beheer, in opdracht van een klant van ons. De site werd ontwikkeld door Milk & Cookies, een bende prettig gestoorde designers. Bij de migratie van de database naar de nieuwe machine (vanaf een machine die niet in ons beheer had, en waar we geen toegang tot hadden) moesten we een dump krijgen van de designers. We kregen de file in onze mailbox, en deze moest in de MySQL database gezet worden.

Om alles nog wat complexer te maken werkt de site op de Macromedia (ondertussen Adobe) Coldfusion MX 7 server, aangezien het een coldfusion site is. CMX7 is een Java-gebasseerde application server, die een eenvoudige scripting toelaat, zonder al te veel problemen (of mogelijkheden) te hebben met connecties en zo. De site administrator dient dit in te stellen in het administration panel.

Na enige tijd kregen we melding dat er vreemde karakters in enkele entries zaten, en dat deze niet goed weergegeven werden op de site. Er waren ondertussen nieuwe entries toegevoegd, en ook deze waren niet goed. Echter, in phpMyAdmin op de server, die niet door de CMX7 server werd afgehandeld, maar rechtstreeks door Apache/PHP, bleek het enkel de oude entries te zijn die verkeerd weergegeven waren, en niet de nieuwe. Deze waren goed. Er waren 3 stappen in het spel:

  • De gedumpte file die we origineel hadden
  • De database server zelf. Deze stond in latin1.
  • Coldfusion MX7

Enig zoekwerk leverde me volgende zekerheid: Als CMX7 niets anders verteld wordt, werkt die in UTF8. Dat stemde ook overeen met het feit dat mijn Firefox elke pagina in UTF-8 weergaf, ondanks de “charset=iso-8859-1″ melding bovenaan de pagina. Een UTF-8 pagina geeft als eerste byte een speciaal karakter mee, zodat deze herkend kan worden.

Eerst en vooral heb ik de database omgezet naar UTF-8. Eerst en vooral een dump van de database nemen, en dan met enkele welgeplaatste “ALTER TABLE xxx DEFAULT CHARACTER SET = utf8″ commando’s de definities omgezet naar UTF8. Daarmee was mijn data echter nog niet in UTF8, ik wist zelfs niet wat het wel was.

De juiste codepagines vinden was niet zo een groot probleem. Via een pagina die ik vond op het internet, kon ik vinden welke sequence aan een bepaalde charset gekoppeld was. (Om te volgen, scroll helemaal naar onderen, bij het Euro symbool) Via een mysqldump (met default-charset=latin1, want mijn data was nog latin1), kreeg ik onderstaande voor de oude data:oude_data_euro.jpg

Ik wist dat het een euro symbool moest zijn, en helemaal onderaan de pagina zien we dat de “E2 82 AC” sequence dus UTF-8 data is, en het eurosymbool voorstelt. Let er echter op dat we dit gedumpt hadden in latin1. Dat was dus gewone UTF8-data.

De nieuwe data gaf dit:nieuwe_data.jpg

Een karakter met waarde “80″. Dit moest ook terug een Euro-symbool zijn. We zien dat ASCII 80 in verschillende codepages het eurosymbool is. De tweede deed een belletje rinkelen (codepage 1252 dus), want dit is de standaard Windows codepage.

De oude data kon dus via volgende commando’s hersteld worden (gewoon als latin1 dumpen, en als utf8 terug inladen, aangezien de data wel goed was):


mysqldump --set-default-charset=latin1 database tabelnaam > file
mysql --set-default-charset=utf8 database < file

Vreemd genoeg kreeg ik het nog altijd niet goed op de webpagina. Maar dat is voor later.

De nieuwe data heb ik via iconv omgezet:


iconv -f CP1252 -t UTF-8 tabeldump > tabeldump.utf8

Een snelle blik gaf me zekerheid dat het “80″ controlekarakter omgevormd was tot “E2 82 AC” waar er een Euro moest staan. Zover waren we al. Met wat scripting dan de boel gedumpt, de oude van de nieuwe data gescheiden, de nieuwe omgezet, en beide terug ingeladen.

Dubbel gecontroleerd dat alles van de database standaard op utf8 stond:


mysql> show variables like 'char%';
+--------------------------+----------------------------+
| Variable_name | Value |
+--------------------------+----------------------------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+

UTF-8-er kan niet denk ik. Dan was er nog het probleem dat de data natuurlijk niet goed weergegeven werd. Elk controlekarakter werd nogmaals in UTF-8 ge-encodeerd (dus, utf-8 op reeds utf-8 data). Ik vermoedde dat de database connectie in CMX7 niet heel zuiver was, en heb een testopstelling gemaakt. Een nieuwe database met dezelfde data, maar deze keer met de JDBC connector van MySQL ipv de standaard driver in Coldfusion. Deze pagina geeft weer hoe je deze kan installeren en testen in coldfusion. Snel een coldfusion testpagina gemaakt, en het leek te werken. Dan een pagina van de site van de Culture club waar het fout liep omgebouwd zodat deze de nieuwe datasource gebruikte, en alles bleef werken.

Uiteindelijk de datasource aangepast naar de nieuwe datasource, en alles lijkt nu perfect te werken.

Charsets zijn echt wel een “p**n in the ass”.

wanneer het stof gaat liggen

Monday, April 10th, 2006

Vandaag botste ik op deze blog entry van Bob Parsons, CEO van Godaddy.com, een van werelds grootste domeinboeren.

Uiteindelijk staat er niet meer in dan wat ik al wist, maar toch nog even mijn gedacht hierover. Mr Parsons beweert dat de landrush compleet verkeerd verliep, en dat het een algemeen fiasco was.

De landrush verliep vlot, en alle servers hielden het goed uit. De online whois viel er wel vantussen, maar dat was enigzinds te verwachten, en zorgde niet voor problemen bij de registrars, enkel bij de eindklanten die hun status wensten te zien. De aanloop naar de landrush verliep minder chaotisch dan de aanloop naar sunrise 1 en 2, waar Eurid enkele dagen voor het begin van de sunrises nog wijzigingen aanbracht aan het systeem. Ze leren dus toch.

Een probleem dat hij aanhaalt zijn de spookbedrijven, en dat zo bepaalde bedrijven meer registraties konden binnenhalen. Ik denk niet dat godaddy.com veel problemen zou hebben om dit ook te doen, en hier zeker genoeg cash voor kon vrijmaken, en Bob heeft dus geen reden tot klagen. Kleinere bedrijven kunnen dit natuurlijk niet, en deze hebben wel te klagen. Ik moet wel opmerken dat op een van de eerste samenkomsten van Eurid, deze vraag expliciet werd gesteld (“mag een bedrijf meerdere registrys hebben?”), en dat het antwoord van Eurid duidelijk was (“Ja”). Het mocht dus, en men moest er zelfs geen spookbedrijven voor oprichten. Waarom sommigen dit wel deden, kan misschien een gevolg zijn van gewijzigde reglementen na de roadshow van Eurid. Als dit later gewijzigd is, en er zijn spookbedrijven opgericht om dit te omzeilen, kan een onderzoek misschien geen kwaad.

Mr Parsons stelt voor om alle bedrijven aan een onderzoek te onderwerpen, en enkel deze die effectief domeinregistraties aanbieden aan derden nog toe te laten, en de andere op te doeken en hun domeinen vrij te geven. Dat zal weinig oplossen, en de kans is heel klein dat Eurid het lef heeft om dit te doen. Eurid is ongeveer gelijk aan Dns.be, en daar hebben ze ook nooit de ballen om iets te doen, als het erop aankomt. Probleem is dat, als ze het eenmaal doen, ze altijd gevraagd zullen worden om in te grijpen, en DNS.Be; oeps, Eurid; staat liever aan de zijlijn.

Wat me meer tegen de borst stuit is het misbruik van bvb het beeldrecht om eender welke goede namen in sunrise 1 en 2 te kapen. Een goed voorbeeld is de domeinnaam “hypotheek.eu”, die door een bedrijf geregistreerd is omdat deze een recht hebben op “h&y&p&o&t&h&e&e&k” in Malta (EU whois). Het is een handig omzeilen van de regels, en in theorie is er weinig tegen te doen (regels zijn regels, en ze gelden voor iedereen), maar het is toch duidelijk misbruik.

Merk echter op dat de waarde van een .eu momenteel quasi nihil is, aangezien niemand weet dat .eu domeinnamen bestaan. Enkel heel generieken namen zijn misschien vandaag van enige waarde. De enige die hier gouden zaken deed is Eurid, die als VZW zomaar even 10 miljoen euro binnenhaalde op 1 dag. De kosten zullen niet gering zijn (geschoold personeel, in elke mogelijke taal van de eu, goede planning en zwaar servermateriaal…), maar het lijkt me onwaarschijnlijk dat deze berg geld volledig opgemaakt zal worden; of dat er andere minder correcte uitgaven zullen gemaakt worden. Een monopolie in handen geven van een entiteit (op Europees of op landelijk niveau; lees, “Eurid” of “Dns.be”), en dan geen controle uitoefenen is hoe dan ook verkeerd. Kijk naar de Sidn fiasco in Nederland als je een extreem voorbeeld wenst te hebben. Ik hoop dat er toch enige controle voorzien wordt bij Eurid, maar heb er geen al te grote hoop op (lang leve het beeld dat de burger heeft van Europa).