<?xml version='1.0' encoding='UTF-8'?><?xml-stylesheet href="http://www.blogger.com/styles/atom.css" type="text/css"?><feed xmlns='http://www.w3.org/2005/Atom' xmlns:openSearch='http://a9.com/-/spec/opensearchrss/1.0/' xmlns:georss='http://www.georss.org/georss' xmlns:gd='http://schemas.google.com/g/2005' xmlns:thr='http://purl.org/syndication/thread/1.0'><id>tag:blogger.com,1999:blog-8147510727652724927</id><updated>2012-02-16T07:34:36.108+01:00</updated><title type='text'>lex-lingo</title><subtitle type='html'></subtitle><link rel='http://schemas.google.com/g/2005#feed' type='application/atom+xml' href='http://lex-lingo.blogspot.com/feeds/posts/default'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/8147510727652724927/posts/default?max-results=100'/><link rel='alternate' type='text/html' href='http://lex-lingo.blogspot.com/'/><link rel='hub' href='http://pubsubhubbub.appspot.com/'/><author><name>jv</name><uri>http://www.blogger.com/profile/12562747841240076319</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='24' height='32' src='https://www.xing.com/img/users/4/d/5/6a651f8fc.6038062.jpg'/></author><generator version='7.00' uri='http://www.blogger.com'>Blogger</generator><openSearch:totalResults>2</openSearch:totalResults><openSearch:startIndex>1</openSearch:startIndex><openSearch:itemsPerPage>100</openSearch:itemsPerPage><entry><id>tag:blogger.com,1999:blog-8147510727652724927.post-890876473818602836</id><published>2011-09-29T10:23:00.000+02:00</published><updated>2011-10-01T16:53:37.182+02:00</updated><title type='text'>Willkommen bei Lingo!</title><content type='html'>&lt;i&gt;Lingo&lt;/i&gt; ist ein frei verfügbares System zur linguistisch und statistisch basierten automatischen Indexierung des Deutschen und Englischen. &lt;i&gt;Lingo&lt;/i&gt; arbeitet mit einem Wörterbuchmodell, das eine Grundformidentifizierung bzw. -reduktion mit einem Grundformenwörterbuch und einer zugehörigen einfachen Suffixliste realisiert. &lt;i&gt;Lingo&lt;/i&gt; verfügt zusätzlich über eine algorithmische Kompositumzerlegung, eine algorithmische und lexikalische Mehrworterkennung sowie eine allgemeine lexikalische Relationierung.&lt;i&gt; Lingo&lt;/i&gt; unterliegt der &lt;a href="http://www.gnu.org/licenses/gpl.html" target="_blank"&gt;GNU General Public License&lt;/a&gt; (GPL).&lt;br /&gt;&lt;br /&gt;Einen ersten Eindruck von der Funktionalität vermittelt &lt;a href="http://linux2.fbi.fh-koeln.de/lingoweb/"&gt;Lingo Web&lt;/a&gt;:&lt;br /&gt;&lt;br /&gt;&lt;div class="separator" style="clear: both; text-align: center;"&gt;&lt;/div&gt;&lt;div class="separator" style="clear: both; text-align: center;"&gt;&lt;a href="http://linux2.fbi.fh-koeln.de/lingoweb/" title="Lingo Web"&gt;&lt;img border="0" height="302" src="http://1.bp.blogspot.com/-fLBQmE3dW0o/TocpHCkUD2I/AAAAAAAAACg/r0BokELR2t4/s320/lingoweb.png" width="320" /&gt;&lt;/a&gt;&lt;/div&gt;&lt;br /&gt;&lt;i&gt;Lingo&lt;/i&gt; ist vollständig in &lt;a href="http://www.ruby-lang.org/de/"&gt;Ruby&lt;/a&gt; programmiert, weshalb vor dem Einsatz von &lt;i&gt;Lingo&lt;/i&gt; eine &lt;a href="http://www.ruby-lang.org/de/downloads/"&gt;Ruby-Umgebung&lt;/a&gt; installiert werden muss.&lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/8147510727652724927-890876473818602836?l=lex-lingo.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://lex-lingo.blogspot.com/feeds/890876473818602836/comments/default' title='Kommentare zum Post'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=8147510727652724927&amp;postID=890876473818602836' title='0 Kommentare'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/8147510727652724927/posts/default/890876473818602836'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/8147510727652724927/posts/default/890876473818602836'/><link rel='alternate' type='text/html' href='http://lex-lingo.blogspot.com/2007/09/willkommen-bei-lingo.html' title='Willkommen bei Lingo!'/><author><name>le</name><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><media:thumbnail xmlns:media='http://search.yahoo.com/mrss/' url='http://1.bp.blogspot.com/-fLBQmE3dW0o/TocpHCkUD2I/AAAAAAAAACg/r0BokELR2t4/s72-c/lingoweb.png' height='72' width='72'/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-8147510727652724927.post-5195718837870178061</id><published>2011-09-29T00:00:00.000+02:00</published><updated>2011-09-29T15:23:06.481+02:00</updated><title type='text'>Lingo - erste Schritte</title><content type='html'>Das Indexierungssystem &lt;i&gt;Lingo&lt;/i&gt; leistet eine Grundformidentifizierung bzw. Grundformreduktion mit einem Grundformenwörterbuch und einer zugehörigen einfachen Suffixliste. Zusätzlich wurden für &lt;i&gt;Lingo&lt;/i&gt; eine algorithmische und eine lexikalische Mehrworterkennung sowie eine allgemeine lexikalische Relationierung von Termen realisiert. Neben diesen linguistischen Kernfunktionen ist es möglich, mit &lt;i&gt;Lingo&lt;/i&gt; Termgewichte nach absoluter und relativer Auftretenshäufigkeit zu ermitteln.&lt;br /&gt;&lt;br /&gt;&lt;i&gt;Lingo&lt;/i&gt; ist vollständig in der Programmiersprache &lt;i&gt;Ruby&lt;/i&gt; programmiert, alle Programmmodule haben daher die Endung &lt;i&gt;rb&lt;/i&gt; und sind, eine installierte Version von &lt;i&gt;Ruby&lt;/i&gt; vorausgesetzt, auf der Kommandozeile ausführbar. Da &lt;i&gt;Lingo&lt;/i&gt; primär für Forschung und Lehre eingesetzt wird, wurde bei der Entwicklung großer Wert auf die Transparenz des Programms und seiner Bestandteile, sowie auf die Transparenz der Programmabläufe bei einer Indexierung gelegt. Alle Funktionen des Systems sind umfangreich konfigurierbar und damit für individuelle Einsatzzwecke leicht anzupassen.&lt;br /&gt;&lt;br /&gt;Die Funktionen von &lt;i&gt;Lingo&lt;/i&gt; werden jeweils von eigenen Programmmodulen (&lt;i&gt;attendees&lt;/i&gt;) realisiert, die in einem Indexierungslauf (&lt;i&gt;Lingo&lt;/i&gt;-Sitzung) hintereinander geschaltet sind und so aufeinander aufsetzen. Eine &lt;i&gt;Lingo&lt;/i&gt;-Sitzung ist aufgebaut wie eine Besprechung mit mehreren Teilnehmern (&lt;i&gt;attendees&lt;/i&gt;), die über eine Konfiguration eingeladen werden. Die Fähigkeiten der eingeladenen Teilnehmer bestimmen das Besprechungsergebnis, d. h. die Ergebnisse der Indexierung.&lt;br /&gt;&lt;br /&gt;&lt;i&gt;Lingo&lt;/i&gt; verfügt über keine grafische Benutzeroberfläche. Sämtliche Programmabläufe werden über die Kommandozeile gestartet. Für die Installation des Programms muss dieses als Archivdatei heruntergeladen und in ein eigenes Verzeichnis entpackt werden. Nach der Installation (dem Entpacken des Archivs) von &lt;i&gt;Lingo&lt;/i&gt; ergibt sich folgende Verzeichnisstruktur (aufgeführt sind nur die wichtigsten Verzeichnisse):&lt;br /&gt;&lt;br /&gt;&lt;span style="font-family: &amp;quot;Courier New&amp;quot;,Courier,monospace;"&gt;.../lingo&lt;/span&gt;&lt;br /&gt;Das Hauptverzeichnis mit dem &lt;i&gt;Lingo&lt;/i&gt;-Programm (Endung &lt;i&gt;rb&lt;/i&gt;) und den Konfigurationsdateien (Endungen &lt;i&gt;cfg&lt;/i&gt;)&lt;br /&gt;&lt;br /&gt;&lt;span style="font-family: &amp;quot;Courier New&amp;quot;,Courier,monospace;"&gt;.../lingo/de&lt;/span&gt;&lt;br /&gt;Quellen (Textdateien), aus denen die Wörterbuch-Datenbanken aufgebaut werden&lt;br /&gt;&lt;br /&gt;&lt;span style="font-family: &amp;quot;Courier New&amp;quot;,Courier,monospace;"&gt;.../lingo/de/store&lt;/span&gt;&lt;br /&gt;Wörterbuch-Datenbanken (von Lingo beim ersten Start automatisch generiert)&lt;br /&gt;&lt;br /&gt;&lt;span style="font-family: &amp;quot;Courier New&amp;quot;,Courier,monospace;"&gt;.../lingo/lib&lt;/span&gt;&lt;br /&gt;Verzeichnis mit den Programmdateien&lt;br /&gt;&lt;br /&gt;&lt;span style="font-family: &amp;quot;Courier New&amp;quot;,Courier,monospace;"&gt;.../lingo/txt&lt;/span&gt;&lt;br /&gt;Verzeichnis der Ein- und Ausgangsdaten der Indexierung&lt;br /&gt;&lt;br /&gt;Als linguistisches, wörterbuchgestütztes System ist &lt;i&gt;Lingo&lt;/i&gt; von den verfügbaren und eingebundenen Wörterbüchern direkt abhängig. &lt;i&gt;Lingo&lt;/i&gt;-Wörterbücher sind als Quelltext reine Textdateien, die mit jedem Editor bearbeitet werden können. Für die Verwendung der Wörterbücher in Indexierungsläufen müssen diese aus Performance-Gründen in Datenbankdateien umgewandelt werden. &lt;i&gt;Lingo&lt;/i&gt; prüft bei jedem Programmstart, ob es möglicherweise neue oder geänderte Wörterbuchquellen gibt und wandelt diese, falls noch nicht geschehen, selbstständig in Datenbankdateien um. Die generierten Datenbanken werden im Verzeichnis &lt;i&gt;/store&lt;/i&gt; als jeweils zusammengehörende &lt;i&gt;dir&lt;/i&gt;- und &lt;i&gt;pag&lt;/i&gt;-Dateien abgelegt.&lt;br /&gt;&lt;br /&gt;Nach der Installation von &lt;i&gt;Lingo&lt;/i&gt; (und ggf. einer &lt;i&gt;Ruby&lt;/i&gt;-Umgebung) soll ein erster Systemstart das Funktionieren des Programms testen. Dazu ist es nötig, in ein Terminal (bzw. unter &lt;i&gt;Windows&lt;/i&gt; der &lt;i&gt;DOS&lt;/i&gt;-Eingabeaufforderung) in das &lt;i&gt;Lingo&lt;/i&gt;-Programmverzeichnis zu wechseln (dies ist die oberste Ebene des &lt;i&gt;Lingo&lt;/i&gt;-Installationsbaums, dort muss sich die Programmdatei &lt;i&gt;lingo.rb&lt;/i&gt; befinden). Für einen ersten Start benötigt Lingo mindestens den Programmaufruf und die Nennung einer Datei, die zu indexieren ist. Für diesen Zweck wird &lt;i&gt;Lingo&lt;/i&gt; mit einer Beispieldatei &lt;i&gt;artikel.txt&lt;/i&gt; ausgeliefert, die sich im Unterverzeichnis &lt;i&gt;/txt&lt;/i&gt; befindet. Um die Indexierung dieser Datei zu starten, ist folgende Eingabe in einem Terminal erforderlich:&lt;br /&gt;&lt;br /&gt;&lt;span style="font-family: &amp;quot;Courier New&amp;quot;,Courier,monospace;"&gt;ruby lingo.rb txt/artikel.txt&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;Nach dem Absenden des Befehls werden zunächst Zeilen sichtbar, in denen Prozentwerte hochgezählt werden. Dies ist die Phase des Aufbaus der Wörterbuchdateien, die im Auslieferungszustand noch nicht vorhanden waren. Danach werden im Terminal rasch Textzeilen angezeigt, bis die Indexierung beendet ist. Die durchgelaufenen Textzeilen sind nicht das Ergebnis des Indexierungslaufs. Die Ergebnisdateien befinden sich alle im Unterverzeichnis &lt;i&gt;/txt&lt;/i&gt;. Alle dort liegenden Dateien, die mit &lt;i&gt;artikel.&lt;/i&gt; beginnen, sind Ergebnisdateien dieses ersten Indexierungslaufs.&lt;br /&gt;&lt;br /&gt;Das System läuft nun und kann für eigene Anwendungen konfiguriert und genutzt werden. Ein Lehrveranstaltungsskript zu einem einsemestrigen Laborpraktikum mit &lt;i&gt;Lingo&lt;/i&gt; führt tiefer in die Materie ein und kann &lt;a href="http://linux2.fbi.fh-koeln.de/kram/atmidx-1-2.pdf"&gt;hier&lt;/a&gt; als &lt;i&gt;pdf&lt;/i&gt; heruntergeladen werden.&lt;br /&gt;&lt;br /&gt;&lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/8147510727652724927-5195718837870178061?l=lex-lingo.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://lex-lingo.blogspot.com/feeds/5195718837870178061/comments/default' title='Kommentare zum Post'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=8147510727652724927&amp;postID=5195718837870178061' title='0 Kommentare'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/8147510727652724927/posts/default/5195718837870178061'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/8147510727652724927/posts/default/5195718837870178061'/><link rel='alternate' type='text/html' href='http://lex-lingo.blogspot.com/2007/09/lingo-architektur.html' title='Lingo - erste Schritte'/><author><name>le</name><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry></feed>
