[C#][TUTORIAL] Text-to-Speech und Speech-to-Text(Spracherkennung)

Hallo und herzlich willkommen zu meinem 1. Tutorial.
Hier werde ich euch zeigen, wie ihr in C# gesprochenen Text in einen schriftlichen Text umwandelt und wie ihr Text vom "vorlesen" lassen k�nnt.

1.: Was brauchen wir?
2.: "Speech-to-Text"
2.1: Auf die Speech Assembly verweisen
2.2: Code
3.: "Text-to-Speech"
3.1 Code
Abschluss

1.
Visual Studio C#
Mikrofon oder Headset

2.
Bei "Speech-to-Text" wird ein gesprochener Text erkannt und kann dann im Porgramm weiterverarbeitet werden. Im Gro�en und Ganzen ist das keine besondere Kunst, denn Microsoft hat daf�r die Speech.Recognition Funktion mitgeliefert. Daf�r m�ssen wir allerdings zuerst einen Verweis auf die Speech-Assembly erstellen. Dies ist im folgenden Teil 2.1 erkl�rt.

2.1
Zuerst �ffnen wir Visual Studio und erstellen ein neues Windows-Form Projekt.
Das Projekt habe ich einfach mal SpeechTutorial genannt. Nun wird der Verweis folgenderma�en erstellt:
1.Rechtsklick auf das Projekt im Solution Explorer und w�hlt "Add Reference".

[Only registered and activated users can see links. Click Here To Register...]#

2.W�hle oben .NET aus und such nach System.Speech.

[Only registered and activated users can see links. Click Here To Register...]

3.Klick auf OK.

2.2
Kommen wir nun zum Code.
Zu Beginn binden wir per using die Namespace ein:

Code:

using System.Speech.Recognition;

Als n�chstes k�nnen ziehen wir auf die Form ein Button, eine ListBox und eine RichTextBox.
Per Doppelklick auf den Button erstellen wir ein Klick-Event. In das neu hinzugef�gte Event kopieren wir zun�chst folgenden Code, der sp�ter genauer erkl�rt wird.

Davor erstellen allerdings einen Verweis auf die SpeechRecognitionEngine Instanz. Diese f�gen wir so an:

Code:

 public Form1()
        {
            InitializeComponent();
        }
        private SpeechRecognitionEngine spracherkennung = new SpeechRecognitionEngine();

Nun der Rest

Code:

spracherkennung.SetInputToDefaultAudioDevice();
spracherkennung.LoadGrammar(new DictationGrammar());
spracherkennung.SpeechRecognized += new EventHandler<SpeechRecognizedEventArgs>(spracherkennung_SpeechRecognized);
spracherkennung.RecognizeAsync(RecognizeMode.Multiple);

Mit

Code:

SpeechRecognitionEngine spracherkennung = new SpeechRecognitionEngine();

wird ein Verweis auf die SpeechRecognitionEngine Instanz erstellt.

Code:

spracherkennung.SetInputToDefaultAudioDevice();

Es wird das Standard Mikrofon benutzt.

Code:

spracherkennung.LoadGrammar(new DictationGrammar());

Hier wird die Grammatik geladen, welche letztendlich die Spracheingabe indentifiziert und in einen lesbaren Text umwandelt.

Code:

spracherkennung.SpeechRecognized += new EventHandler<SpeechRecognizedEventArgs>(spracherkennung_SpeechRecognized);

Dieses Event wird ausgel�st, wenn das Programm eine Spracheingabe feststellt.

Code:

spracherkennung.RecognizeAsync(RecognizeMode.Multiple);

Dies bedeutet, das nachdem das Programm einen Input bemerkt hat, es nicht aufh�rt sondern auf die n�chsten Spracheingaben wartet.

Kommen wir nun zu dem Event. Daf�r f�gen wir folgenden Code ein.

Code:

void spracherkennung_SpeechRecognized(object sender, SpeechRecognizedEventArgs e)
        {
            foreach (RecognizedWordUnit wort in e.Result.Words)
            {
                listBox1.Items.Add(wort.Text);
            }
        }

In dem Event wird per foreach jedes festgestellte Wort einzeln ausgegeben und der ListBox hinzugef�gt.

Alternativ dazu kann man auch den ganzen Satz, den man spricht in einer RichTextBox ausgeben lassen.

Code:

richTextBox1.AppendText("\r\n" + e.Result.Text);

Wenn wir nun das Programm starten, auf den Button klicken und in das Mirko reden, sollte der Text entweder in der listBox oder in der RichTextBox erscheinen. Gehen wir nun weiter zu "Text-to-Speech".

3

Die Funktion Speech.Synthesis erm�glicht es uns, dem Programm einen Text zu geben, den er dann "vorliest".

3.1

Zu Beginn erstellen wir ein neues Projekt. Wir wiederholen Schritt 2.1 und binden die Namespace ein, diesmal allerdings mit:

Code:

using System.Speech.Synthesis;

Die Form best�cken wir nun mit einem Button und einer "Multiline" Textbox.

Wie eben, zeige ich erstmal den kompletten Code:

Auch hier erstellen wir erst einmal ein Verweis auf die SpeechSynthesizer Instanz:

Code:

 public Form1()
        {
            InitializeComponent();
        }
       private SpeechSynthesizer speaker = new SpeechSynthesizer();

Code:

sprecher.SetOutputToDefaultAudioDevice();
sprecher.Rate = -1;
sprecher.Volume = 100;
sprecher.SelectVoice("Microsoft Anna");
sprecher.SpeakAsync(textBox1.Text);

Zur genaueren Erkl�rung:

Code:

SpeechSynthesizer sprecher = new SpeechSynthesizer();

Es wird ein Verweis auf die SpeechSynthesizer Instanz erstellt.

Code:

sprecher.SetOutputToDefaultAudioDevice();

Der aktuelle Standard Lautsprecher wird zum ausgeben des Textes benutzt.

Code:

sprecher.Rate = -1;

Hier kann die Schnelligkeit eingestellt werden, mit der der Text vorgelesen werden soll.

Code:

sprecher.Volume = 100;

Dieser Abschnitt sollte weitestgehend selbsterkl�rend sein, denn hier wird die Lautst�rke geregelt.

Code:

sprecher.SelectVoice("Microsoft Anna");

Es stehen verschiedene Stimmen zur Auswahl. Standardm��ig ist die englische Stimme "Microsoft Anna" eingestellt. Deutsche Stimmen gibt es auch, die m�ssen allerdings erst installiert werden. Dies ist 4 Post's weiter erkl�rt ;)

Code:

sprecher.SpeakAsync(textBox1.Text);

Hier wird "sprecher" der zu lesende Text �bergeben. In unserem Fall die Textbox.

Die Text-zu-Sprach Funktion ist nun fertig und kann getestet werden.
(Am besten einen englischen Text, denn wenn man einen deutschen von einer englischen Stimme vorlesen l�sst, h�rt sich das ein wenig komisch an.)

Abschluss

Jetzt kann man das Ganze nat�rlich beliebig weit ausbauen und z.B. eine Sprachsteuerung f�r den Computer entwickeln. Doch das ist jetzt euch �berlassen ;)

Nun sind wir auch schon am Ende des Tutorials angelangt. Ich hoffe es war verst�ndlich, auch wenn es mein 1. Tutorial war.

aera12

Quote:

Originally Posted by V8II

Genial! Die Spracherkennung hat nur leiche M�ngel ^^ Aus "Elitepvpers" macht er "gelegentlich Operas" und so weiter.
'text to speech" redet immer nur auf Englisch oder? Gibts das auch auf deutsch? Ist aber ganz am�sant wie manches ausgesprochen wird :D

Edit: Du solltest nicht bei jedem Klick-Event einen neuen SpeechSynthesizer erstellen ... eine einmalige erstellung w�hre besser

Danke, du hast Recht. Ich setzt mich direkt dran und verbesser es. ;)

Quote:

Originally Posted by Kentazo

Nicht schlecht
Danke dir.

Dank dir f�rs Feedback :)

Doch nun zu dem Sprachpaket auf Deutsch!

Wie kann man denn nun die "Ausgabe-Sprache" auf Deutsch stellen?
Ganz einfach:
1. Besucht diesen Link: [Only registered and activated users can see links. Click Here To Register...]

[Only registered and activated users can see links. Click Here To Register...]

Installiert die Datei einfach.

2. Besucht diesen Link: [Only registered and activated users can see links. Click Here To Register...]

[Only registered and activated users can see links. Click Here To Register...]

Installiert auch diese Datei.

Danach sollten euch "LH Anna" und "LH Stefan" als Deutsche Sprachpakete zu Seite stehen.
Das ganze k�nnt ihr folgenderma�en im Code festlegen:
Ihr �ndert einfach die Zeile

Code:

sprecher.SelectVoice("Microsoft Anna");

f�r eine m�nnliche Stimme durch

Code:

sprecher.SelectVoice("LH Stefan");

oder f�r eine weibliche Stimme durch

Code:

sprecher.SelectVoice("LH Anna");

Das ganze sollte dann auf Deutsch sein.

aera12