2010-10-27 Om PHP-lexikon ============== Om man lägger ut ett lexikon i form av en vanlig textfil kan man slå i det med hjälp av ett html-formulär och en php-fil. Om man använder metoden GET för att kommunicera mellan formuläret och php-filen överförs informationen via en öppen internet-adress. Sådana lexikon är alltså åtkomliga och LexSup kan slå i dem. Om man i ett LexSup-lexikon lägger in en mapp som heter web och i den mappen lägger en fil som heter web.txt avslutar LexSup varje sökning med att lägga raderna i denna fil i Utordrutor. Om man aktiverar en sådan utordruta (genom att klicka på den eller med en siffra) söker LexSup efter det som står där. Om första tecknet är ≺ letar LexSup på Internet är det ≻ letar LexSup på den egna datorn. Man kan i web.txt lägga in en del omkodningar men har man inte gjort det tolkas det som står inom " " som den adress som LexSup skall leta efter. Inne mellan " och " kan man lägga in "Inord" alltså "xxxxxxx"Inord"xxxxx". LexSup ersätter då "Inord" med det som står i Inordrutan. Resultatet presenteras i en sänkt Browserruta. Man kan alltså se resultatet och samtidigt ha kvar tillgången till den text man arbetar med. Under UBUNTU - WINE fungerar inte Browserrutan som den skall. Den visas men den tar inte emot signaler. Den går t ex inte att scrolla. Om man vill ha många möjligheter att nå olika lexikon får man en massa Utordrutor vid varje uppslag. LexSup kan ha upp till 100 alternativ men det blir svårhanterligt. Man kan då lägga en fil som heter weblista.txt i mappen web, alltså i samma mapp som web.txt ligger. Om man då i web.txt lägger in en rad där det står >& Weblänklista får man vid varje uppslag upp den i en Utordruta. Aktiverar man den läser LexSup den filen som en länklista och visar resultatet i en lista som visas över Kommentarrutan. Klickar man på en rad i listan hämtas adressen enligt samma regler som för web.txt. Möjligheten att använda PHP-lexikon innebär inte bara att LexSup kan slå i olika lexikon. Det ger även en möjlighet att lägga ut LexSup-lexikonen som PHP-lexikon. Jag har nu under lexsup.se lagt en mapp som heter lexsup/php där jag lagt några lexikon och en php-fil som kan slå upp i dem. Uppslag görs med hjälp av ett formulär som man når via länkenUppslagsformulär
som finns under rubrikenSvensk lexikoncentral
Ibland behöver man slå upp något enstaka ord och det kan då vara enklare att gå via Uppslagsformuläret än att öppna LexSup. Men det finns några skillnader mellan dessa sätt att slå upp. Via uppslagsformuläret kan du bara slå upp ett helt ord och uppslaget avser bara en exakt träff. I LexSup görs uppslag för varje bokstav som du skriver in och du får första träff som stämmer med vad du skrivit. I LexSup får du också en indikering av om uppslagsordet inleder en fras som finns i lexikonet. En gång i tiden använde man stora bokstäver för filnamn. Detta har i vissa fall följt med i LexSup och i ett flertal lexikon har filnamnen stor begynnelsebokstav. Detta visade sig ge problem med php-hanteringen. Jag har därför bytt till små begynnelsebokstäver och hoppas att detta skall fungera problemfritt. Om du sparar Uppslagsformuläret som Webbarkiv får du en fil som går att använda direkt utan att du behöver gå in på lexsup.se. Du kan öppna den med Anteckningar och kommer då åt att ändra default-värden. Men den innehåller en massa text som lagts till när den sparades så att det är lite svårt att hitta i den. Jag tänker vid nästa uppdatering av installationsprogrammet lägga in formuläret och php-filen under Källkod. Där kan du hämta formuläret och om du vill lägga ut egna lexikon kan du använda php-filen om du lägger php-filen och lexikonen i samma mapp. Val av charset kanske kräver några kommentarer. Det finns nu en strävan att gå över till att använda UTF-8 för tecken som inte ligger inom teckenbytens andra nibble. Men att göra UTF-8-lexikon som man enkelt kan slå i är inte helt lätt. LexSup-lexikonen är därför upplagda på charset. LexSup hanterar teckenbyten på samma sätt för all text. Vilka tecken som visas beror på vilket charset som gäller för det program som visar tecknen. Utfilrutan hanterar alla tecken som om de hörde till ANSI. För att visa tecknen med valt charset används en memoruta och en browseruta som kan visa tecken med olika kodning. Vill man slå upp via Uppslagsformulär för att kopiera in resultatet i ett LexSup-dokument slår man upp med charset iso-8859-1. Vill man däremot slå upp för att se resultatet med ett visst alfabet slår man upp med motsvarande charset. Jag tänkte att det var onödigt att länka från weblista till Uppslagsformulär. Har man öppnat LexSup har man ju direkt tillgång till lexikon. Men jag upptäckte att man kan vilja slå i något annat lexikon än det som man har inne i LexSup. I den weblista som ligger på http://lexsup.se/lexsup/lexsupdat/indes.htm har jag därför lagt med en länk till LexSups Uppslagsformulär.Till http://www.lexsup.se