Projekte

Schnellschreiben mit COSSMA

Motivation

Als die ersten Schreibmaschinen aufkamen, glaubte kaum jemand, dass diese Technik einmal solch eine weltweite Nutzung erfahren könnte. In einem Punkt hat sich bislang konzeptionell allerdings nichts geändert: Die Buchstaben bzw. Ziffern und Satzzeichen werden über eine Tastatur durch Betätigen einer Taste nacheinander erzeugt. Mit Hilfe der Shift-Taste kann dabei zwischen Alternativen (etwa Groß- und Kleinbuchstaben, Ziffern und Sonderzeichen) gewählt werden, zu einem Zeitpunkt wird jedoch genau ein Zeichen erstellt.

Dies begrenzt auf natürliche Weise die Erfassungsgeschwindigkeit, so dass es praktisch nicht möglich ist, gesprochene Sprache zeitgleich zu erfassen. Aus diesem Grund wurden und werden für Spezialfälle – etwa zur Protokollierung von Gerichtsverhandlungen – sog. Stenografier-Maschinen eingesetzt. Diese arbeiten etwa nach dem Prinzip der Stenographie, d.h. nach der Erst-Erfassung muss dieses Ergebnis in einem zweiten Schritt über die ’normale‘ Tastatur in die Schreibschrift umgesetzt oder zumindest nachgebessert werden.

Heute ist es kaum mehr nötig, diese Technik zu verwenden, da es Geräte gibt, die gesprochene Sprache speichern, so dass man später das auf diese Weise Gespeicherte über die (normale) Tastatur erfassen kann.

Inzwischen sind computerbasierte Entwicklungen (Software) verfügbar, die gesprochene Sprache unmittelbar in Text umsetzen. Auch wenn diese Technologie lange noch nicht so ausgereift ist, dass auf Anhieb (etwa ohne vorherige Adaption an einen Sprecher und / oder eine Sprachumgebung) für beliebige, fließend gesprochene Sprache hinreichend gute Ergebnisse erzielt werden, wird sich dieser Bereich doch so weiter entwickeln, dass es eines Tages möglich sein wird, zumindest einen Teil der Texte auf diese Weise zu erzeugen. Noch ferner liegt der Tag, bei dem der (Um)-Weg über eine textuelle Fixierung im Regelfall nicht mehr nötig ist.

Man kann sich also in Zukunft ein Szenario vorstellen, bei dem die unmittelbare Umsetzung gesprochener Sprache in Text mit der Erfassung über die (traditionelle) Tastatur so kombiniert wird, dass jemand zum quasi-professionellen Schreiben nicht mehr tiefgehende Schreibmaschinenkenntnisse haben muss, sondern mehr oder weniger nur noch wissen muss, wo sich die einzelnen Symboltasten befinden.

Es gibt aber auch in Zukunft Situationen, bei denen es entweder nicht möglich ist, laut zu sprechen (logischerweise eine Voraussetzung zur Anwendung des Umsetzungsverfahrens Voice-to-Text), oder aber der Zeitfaktor nicht die entscheidende Rolle spielt, etwa beim ‚denkenden‘ Schreiben oder – wie Kleist es nannte – bei der ‚allmählichen Verfertigung der Gedanken beim Reden‘ (vgl. www.kleist.org/texte/gedanken.htm).

Es gab und gibt nach wie vor also gute Gründe, nach schreibtechnischen Lösungen zu suchen, die das Erfassen über Tastatur beschleunigen.

Problemlösung ‚Computer-Schnell-Schreib-Maschine‘ (COSSMA)

Die nachfolgend beschriebene Lösung ist – um sie von vorneherein in der Anwendung zu präzisieren – in erster Linie für Vielschreiber gedacht. Im Prinzip ist dies jeder, der heute in der Ausbildung das Blind-Schreiben mit zehn Fingern erlernt; es kommen aber auch bestimmte Berufsgruppen – etwa Journalisten und Wissenschaftler – als Nutzer in Frage.

Bei COSSMA handelt es sich um eine spezielle Computer-Tastatur. Technische Voraussetzung ist also die Nutzung eines ‚PC‘, d.h. die Kombination der Texterfassung mit einem Computer. Die bestehende Schnittstelle (Tastaturtreiber) wird dabei zur Übergabe der erfassten Zeichen genutzt.

Zum Verfahren

Das Grundprinzip

Das Prinzip des Einzel-Anschlags wird zugunsten eines Akkord-Anschlags (ähnlich dem Klavier- oder Akkordeonspiel) aufgegeben: Mehrere Finger drücken gleichzeitig (oder quasi-gleichzeitig) verschiedene Tasten. Werden diese losgelassen, wird aus der Tastenkombination die Symbolfolge errechnet, die ‚gedacht‘ war, und an den Tastaturtreiber des Computers weitergegeben. Der Tastaturtreiber muss jetzt entsprechend schnell sein, um die Zeichen weiter zu verarbeiten. Dies ist heute kein Problem mehr.

Die Tastatur ist – allerdings stark sprachspezifisch (s.u.) – so ausgelegt, dass mit einem ‚Griff‘ zumindest eine Silbe, möglichst ein ganzes Wort dargestellt werden kann. Wörter wie ‚Mensch‘, ‚Schlumpf‘, ‚Kinn‘, ‚klein‘ oder ‚Schrift‘ lassen sich beispielsweise mit einem solchen ‚Griff‘ erfassen. Man muss als Nutzer ’nur‘ wissen (bzw. lernen), welche Tasten für welche Buchstaben oder Buchstabenkombinationen bedient werden müssen.

Noch stärker als bei der Normal-Tastatur haben die Tasten – die in der Anordnung für die verschiedenen Sprachen gleich sind – zu jeder Sprache eine sprachspezifische Belegung, auch wenn sich ähnliche Sprachen im ‚Kern‘ weniger stark unterscheiden. Dies hat seinen Grund darin, dass die verschiedenen natürlichen Sprachen unterschiedliche Lautfolgen-Regeln haben. Diese Lautfolgen-Regeln (denen bestimmte Buchstaben-Umsetzungen zugeordnet werden) lassen sich – vereinfacht dargestellt – nutzen, um den Tasten bestimmte ‚Gewichte‘ zuzuordnen: aus diesen ‚Gewichten‘ wird die zu erzeugende Reihenfolge berechnet.

Realisierung, Spezial-Lösungen:

Aus ökonomischen, ergonomischen und technischen Gründen wird nicht jedem Buchstaben 1:1 eine Taste zugeordnet. So gibt es im Deutschen eine Taste für ’sch‘, ‚pf‘, ‚ck‘ u.a.m., während beispielsweise der Buchstabe ‚w‘ durch Betätigung einer Tastenkombination (‚m’+’l‘) dargestellt wird. Da diese Tasten nebeneinander liegen, kann man den Buchstaben mit einem Finger darstellen. Dies ist möglich, da in einer Silbe ‚m‘ und ‚l‘ am Wortanfang oder Wortende nicht oder sehr selten gemeinsam auftreten (zum Detail vgl. die Patentschrift).

Die Tastatur umfasst ein ‚Konsonantenfeld‘ zur Darstellung der Konsonanten bzw. Konsonantenkombinationen vor den / dem Vokal(en) und – spiegelbildlich angeordnet – ein Konsonantenfeld zur Darstellung nach dem / den Vokal(en). Umlaute und Vokalkombinationen werden durch gleichzeitiges Drücken der entsprechenden Vokale im Vokalfeld dargestellt. Auch hier ist die Anordnung der Tasten so, dass man dies in aller Regel mit einem Finger realisieren kann.

Eine besondere Lösung erfordert die Darstellung der Dehnung (Dehnungs-h bei ‚a‘, ‚e‘, ‚o‘, ‚u‘ und Umlauten bzw. Dehnungs-e bei ‚i‘) bzw. der Konsonanten-Verdopplung (’n‘ zu ’nn‘, ‚m‘ zu ‚mm‘ usf.). Dafür wird jeweils eine spezielle Taste (die entsprechend gleichzeitig ‚mit‘ zu drücken ist) zur Verfügung gestellt.

Eine weitere Besonderheit ist die Darstellung des Wortzwischenraums. Da einsilbige Wörter häufiger sind als mehrsilbige (vgl. zudem die Behandlung der Wort-Endungen, s.u.), wird automatisch ein Wortzwischenraum erzeugt, wenn man nicht gleichzeitig einer der sog. No-Blank-Tasten drückt, die dies verhindert.

Ergänzend gibt es noch Tasten für gängige Endungen wie ‚-e‘ oder ‚-en‘. Damit ist es möglich, bestimmte mehrsilbige Wörter (wie ‚Menschen‘ oder ‚Kunde‘) in einem Akkordanschlag (d.h. ‚Griff‘) darzustellen.

Alternativ-Belegung:

Bis dahin wird dem Grundprinzip gefolgt, das man ’nur‘ wissen muss, welche Taste welchen Symbolwert hat, um einen Text zu erfassen. Um die Geschwindigkeit weiter zu steigern, wurde ein Kürzel-Verfahren eingeführt: Jedem Symbolwert (Taste oder Tastenkombination) wurde eine Alternativ-Bedeutung zugeordnet, die genau dann aktiviert wird, wenn in einem Anschlag nur diese Taste bzw. Tastenkombination gedrückt wird. Diese ist mit hochfrequenten Wörtern (der jeweiligen Sprache) belegt. Jedes dieser Wörter kann natürlich auch auf dem ’normalen‘ Erfassungsweg dargestellt werden: Das Wörtchen ‚die‘ kann also entweder durch die Kombinationen ‚d’+’i’+ALT (für Dehnung) oder durch ‚d‘ – (linke Konsonantenseite) dargestellt werden – vorausgesetzt, man erlernt diese alternative Bedeutung.

Um ein Einzelzeichen (etwa den Buchstaben ‚d‘ alleine) zu erstellen, muss man (daher) zusätzlich die ’single-double-Taste drücken.

Technik der Tastatur

Die Konsonantenfelder links und rechts sind schräg angeordnet, um eine weniger belastende Grifftechnik zu ermöglichen. (Welche Finger welche Tasten üblicherweise bedienen, ist im Handbuch beschrieben.)

Eine in die Tastatur eingebrachte spezielle Platine nimmt die Impulse auf und gibt die Werte an einen E-PROM weiter. Dieser berechnet die Symbolfolgen (Buchstabenreihenfolge), die an den Tastaturtreiber des PC weitergereicht werden.

Da der Tastaturtreiber des Mac programmierbar ist, entfällt für diesen Rechner der E-PROM; hier werden die Gewichte an den Treiber weitergereicht, wo dann die Umrechnung über ein entsprechendes Zusatzprogramm erfolgt.

Je Sprache sind entsprechende Umrechnungen erforderlich.

Die Tastatur ist ferner so konstruiert, dass sie in Kombination mit einer herkömmlichen Tastatur verwendet werden kann.

Status

Das Verfahren ist im Jahr 1994 unter der Nr. 40 15 939 in der Bezeichnung „Vorrichtung zum beschleunigten Fixieren eines über eine Tastatur einzugebenden Textes in Buchstaben“ für die Bundesrepublik Deutschland patentiert worden. Patentinhaber ist die SOFTEX GmbH, Saarbrücken.

Es existieren einige Prototypen der Tastatur, ohne dass bislang allerdings eine intensive Vermarktung stattgefunden hat. Ein Exemplar kann zu Testzwecken gegen eine kleine Gebühr ausgeliehen werden.

Für die praktische Anwendung empfiehlt sich die Kombination mit der Rechtschreibhilfe PRIMUS. Damit ist es beispielweise möglich, in eindeutigen Fällen auf die Markierung eines Großbuchstabens (über die Shift-Taste) bei der Erfassung zu verzichten oder auch ‚eigene‘ Kürzel einzufügen.

Chancen und Probleme der Vermarktung

Die Kontakte zu Tastatur-Herstellern zeigten bislang nicht den gewünschten Erfolg. Standard-Tastaturen sind extrem preisgünstig und Massenware, die COSSMA-Tastatur hat es schwer, gegen einen bestehenden Standard anzukommen, vor allem, wenn sie – wie derzeit – in Einzelfertigung entsteht. Zudem werden die Entwicklungen der Umsetzungsverfahren Sprache -> Text als (Gegen)-Argument eingebracht.

Wie interne Tests inzwischen gezeigt haben, entspricht der Zeitaufwand zum systematischen Erlernen der Bedienung der COSSMA-Tastatur in etwa dem Lernaufwand für die Normaltastatur, auch wenn das Prinzip in einigen Punkten eben anders ist. Ebenfalls haben interne Tests gezeigt, dass man die Schreibgeschwindigkeit bei gleichem Lernaufwand gegenüber dem Erfassen mit der Normaltastatur mindestens verdoppeln kann. Dies stellt sich prinzipiell als ein extrem wirtschaftlicher Faktor dar.

Das Prinzip – es gibt beispielsweise zu Französisch ein Konzept – lässt sich auf beliebige Sprachen ausweiten. Dies könnte insbesondere für Sprachen wie Chinesisch, Japanisch oder Koreanisch interessant sein, da die jetzigen Erfassungsverfahren mit Normal-Tastaturen zumindest komplex sind.

Diese Internet-Präsentation dient auch dazu, ggf. auf diesem Wege Kontakte zu Interessenten zu knüpfen, die die Vermarktung mit übernehmen wollen.

Kontakt

Einer der Mit-Erfinder, Hans-Werner Berger, steht bei Anwendungsfragen zur Verfügung. Bei Fragen zum Prinzip bzw. zur Vermarktung kann man sich an den Unterzeichner (und Mit-Erfinder) wenden. Bei technischen Fragen steht Ralf Menssen, ebenfalls Mit-Erfinder, zur Verfügung.

Text des Patents (Patentschrift, S. 1-10)

*** Die folgenden JPEG-Dateien sind zwischen 27 und 180 k groß ***

PAT01.JPG = Titelblatt
PAT02.JPG = Bibliographie
PAT03.JPG = Text S. 2ff.
PAT04.JPG
PAT05.JPG
PAT06.JPG
PAT07.JPG
PAT08.JPG
PAT09.JPG
PAT10.JPG = Patentansprüche

Tastaturübersichten

PAT11.JPG Werte der Einzeltasten, Kürzel zu Einzeltasten; letztere ohne Benutzung der ALT-Taste.
PAT12.JPG Werte der Kombinationstasten
PAT13.JPG Kürzel zu Kombinationstasten ohne Benutzung der ALT-Taste
PAT14.JPG Kürzel bei gleichzeitiger Benutzung der ALT-Taste
PAT15.JPG Kürzel zu Kombinationstasten bei gleichzeitiger Benutzung der ALT-Taste

Schaltplan

Saarbrücken, im Januar 2000

Prof. Dr. Harald H. Zimmermann

D59ZCS1.DOC 2000-01-12

Universität des Saarlandes - Fachrichtung Informationswissenschaft