Bereits in den ersten Vorschlägen der "Facharbeitsgruppe Inhalt" zur Vorbereitung des DFG-Programms "Retrospektive Digitalisierung von Bibliotheksbeständen" haben Wörterbücher eine dominierende Rolle gespielt, nicht nur weil sie besonders intensiv benutzt werden, sondern auch weil elektronische Nachschlagewerke Auswertungsmöglichkeiten bieten, die in ihrer gedruckten Form kaum jemals ausgeschöpft werden können. Die von Internet-Suchmaschinen gesammelten Daten können derzeit weder die Verlässlichkeit noch den Grad an Systematisierung und Tiefenerschließung der in Nachschlagewerken aufbereiteten Informationen erreichen und bleiben daher weit hinter deren Präzision und Umfang zurück.
Digitale Nachschlagewerke sind, wie auch ihre gedruckten Entsprechungen, auf vielfältige Art aufeinander bezogen und damit in gewisser Weise implizit "vernetzt"; eine übergreifende, integrierte Recherche ist jedoch wegen der Unterschiede in der Anlage, Anordnung und Struktur der einzelnen Werke auch im digitalen Medium nicht ohne Weiteres möglich. Nachschlagewerke, die durch inhaltlich-strukturelles Markup in standardisierte und damit vergleichbar gemachte Informationseinheiten gegliedert und durch Metadaten angereichert sind, machen jedoch die impliziten Vernetzungen explizit. Dadurch kann eine neue Qualität der Informationsgewinnung erreicht und die Lücke zwischen der schwerfälligen Benutzbarkeit und eingeschränkten Verfügbarkeit der Buchversionen einerseits und der fehlenden Systematik und Beliebigkeit der Information im Internet andererseits geschlossen werden.
Nach den entsprechenden Vorarbeiten aus den verschiedenen Digitalisierungsprojekten des Kompetenzzentrums stehen im Wörterbuch-Netz unterschiedliche Typen tief annotierter Wörterbücher in digitaler Form zur Verfügung, die bereits in unterschiedlicher Dichte untereinander vernetzt, durch Symptomwertangaben und Metadaten intellektuell erschlossen und recherchierbar oder mit Primärquellen vernetzt sind. Anhand dieser Wörterbücher zu den verschiedenen Varietäten des 'Deutschen' (aber auch darüber hinaus) soll ein standardisierter Einstieg für effiziente Recherchen geschaffen werden, von dem aus sich die nicht standardisierten, heterogen organisierten und verstreuten Informationen verzweigen; heterogen im Hinblick auf synchrone wie diachrone Varianz. Dieses Konzept lässt sich nicht nur auf Wörterbücher anwenden, sondern auch auf die Erschließung großer Korpora übertragen.
Im Gegensatz zu einer bloßen, unverbundenen Bereitstellung verschiedener Nachschlagewerke bietet das Wörterbuch-Netz komplexe und gezielt spezifizierbare Zugänge zum Material durch multidirektionale Verlinkungen. Diese Verlinkungen gehen weit über eine rein ausdrucksseitige Verknüpfung hinaus, indem sie philologische und informationswissenschaftliche Methoden verbinden. Das angestrebte Ideal-Ziel lässt sich als ein vielfältig verknüpftes, dynamisches, intelligentes 'Meta-Wörterbuch' der "deutschen Sprache" beschreiben, dessen Anfänge im Wörterbuch-Netz bereits zu sehen sind.
Voraussetzung für eine Bewertung der Relevanz einzelner Wortformen aus dem Wörterbuchtext und damit für automatische bzw. halbautomatische Vernetzung ist eine standardisierte Kodierung der Wortartikelstrukturen (beispielsweise nach den TEI-Richtlinien). Zusammen mit weiteren inhaltlichen Metadaten, z.B. durch standardisierte Klassifizierungen (DDC, Ontologien), werden dann spezifizierte Recherchen ermöglicht.
In einem ersten Schritt kann durch halbautomatische Verfahren über eine Hyperlemmaliste eine Verlinkung der Stichwörter vorgenommen werden, wie das für den Verbund der mittelhochdeutschen Wörterbücher geschehen ist (www.MWV.uni-trier.de).In einem zweiten Schritt zum automatischen Aufbau der Vernetzungsstrukturen kommen Verfahren aus dem Bereich des Information Retrieval zum Einsatz, nach denen die einzelnen Wortformen aufgrund ihrer Anzahl statistisch bewertet und gewichtet werden. Nach diesem Verfahren lassen sich alle Wortartikel als Vektoren von Wortformen darstellen, die, nach ihrer Gewichtung geordnet, paarweise miteinander verglichen werden. Falls innerhalb zweier Vektoren eine gewisse Anzahl von Übereinstimmungen vorliegt, wird eine Verbindung zwischen den beiden zugrunde liegenden Wortartikeln etabliert. Informationstechnologisch werden die Verbindungen in Form von Kanten in einem Graphen modelliert. Der gesamte Vernetzungsgraph wird in Form von Metadaten über die eigentlichen Wörterbuchdaten gelegt und in einer eigenen Datenbank abgespeichert. Die so etablierten Verweisstrukturen können dann in der graphischen Internetoberfläche visualisiert werden
Neben der Vernetzung der durch das Kompetenzzentrum bereitgestellten Wörterbuchressourcen bietet das Wörterbuch-Netz auch die Möglichkeit, aus externen elektronischen Dokumenten angesprochen zu werden. Über die vor den Wortartikeln eingerichteten Icons kann zum einen die persistente Adresse des betreffenden Artikels abgefragt werden, zum anderen stellt das Kompetenzzentrum auf Anfrage auch die vollständigen Lemmalisten mit den zugehörigen Adressen zur Verfügung, um auf diese Weise eine umfassende Vernetzung zwischen einer externen Wörterbuchinstallation und den Ressourcen im Wörterbuch-Netz realisieren zu können.