
Jeg ved ikke hvor mange af mine læsere her på bloggen (hvis der overhovedet er nogen) der kender til ordspillet Pludr. Hver aften kl. 12 får man præsenteret en ny plade med 5×5=25 bogstaver som man skal bruge til at danne forskellige danske ord, man får oplyst hvor mange ord der findes på spillepladen og hvor mange man harfundet, og så er målet altså at finde alle ordene.
Min mor, som er kendt under navnet “lampetten” derinde, er en af de mange mennesker der er afhængig af sitet (lidt over 4000 har jeg hørt, hvoraf nogle hundrede stykker bliver ved med at komme tilbage dagligt). Jeg selv har, på trods af at jeg finder spillet interessant, ikke tidligere brugt særlig meget tid på spillet, men for nylig er min interesse dog kommet igen.
Jeg gider dog stadig ikke, som de andre brugere derinde, at sidde og gætte mig til ordene derinde, jeg har derimod fundet på at jeg vil lave et script, eller et program, som skal kunne finde alle ordene på pladen for mig. Det er kun et hobbyprojekt for mig, og jeg har ingen intensioner om at frigive programmet eller noget af kildekoden, da jeg ikke ser nogen grund til at folk skal bruge det til at pludre med, det ville jo ødelægge spillet, og målet er også bare at lave en bot som kan finde pludrordene, ikke at ligge øverst på toplisten hver uge.
For at komme så langt skal jeg dog først bruge to ting:
- En liste med ord som overgår, eller i det mindste matcher pludr’s ordliste
- Et script som kan finde ord fra ordlisten på spillepladen
Angående ordlisten så ved jeg at pludr’s ordliste er bygget ud fra ordlister som er fundet på internettet, de linker selv til en masse af dem på deres blog, ergo må det være muligt at lave en ordliste der er næsten identisk med deres. Jeg har i de seneste par dage været i gang med at lave et script i python som automatisk kan hente ordene ud fra disse sider og smide dem i en database, scriptet har dog nogle små fejl som jeg skal have rettet bl.a. med at skaffe ord der starter med de danske tegn, Æ, Ø og Å.
Foreløbig kan import-scriptet, som jeg har valgt at kalde det, hente ordene ud af 2 forskellige online-ordbøger, og det er rimelig let at tilføje support for nye, fra den ene ordbog har jeg hentet godt 17.000 ord, hvilket nok tager omkring et minut at hente, tjekke og gemme, den anden er stadig i teststadiet, men ser ud til at indeholde en hel del flere ord. Jeg ved fra den seneste blogpost på pludrbloggen at de i skrivende stund har 162.834 ord i deres databasen, så der er stadig et stykke vej til at løse en hel plade, men jeg jeg regner med at begynde på selve det script som skal finde ordene når jeg er færdig med at hente ord fra den anden ordbog.
Den største udfordring bliver nok også det script som skal finde ordene, det duer nemlig ikke bare at lave en brute-force løsning der tjekker alle mulige ord på pladen da antallet af ord der skal tjekkes stiger voldsomt med antallet af bogstaver i ordet man tjekker med, men det problem må jeg jo se på når tiden bringer det til mig.
Til de teknisk orienterede kan jeg fortælle at jeg som tidligere nævnt laver både importeren og selve pludrløseren i programmeringssproget Python, som jeg leger en del med og har forelsket mig i lige i øjeblikket, og ordene gemmes i en MySQL database.
Jeg vender måske tilbage med flere oplysninger når jeg finder det relevant.