Zeichens�tze f�r Lexer und Parser

Ich schreibe momentan einen �bersetzer. Quellsprache soll eine Art Programmiersprache sein, die Zielsprache maschinenunabh�ngig.
Der Lexer soll verschiedene Zeichens�tze und Iteratorrepr�sentationen (s. STL) unterst�tzen. Daher sieht meine bisherige Umsetzung etwa so aus:

Spoiler

Sollte token bereits den tats�chlichen Wert speichern, oder nur Lexem und Tokentyp und Funktionen zum Umwandeln in eine Zahl?
Geht das alles vielleicht auch besser?

Von obigem Aussehen ausgehend w�rde eine Parserklasse etwa so aussehen:

Code:

template <typename iterator_type>
class parser {
	// ...
};

Damit w�re der Parser von token_iterator<iterator,char_t,char_traits> abh�ngig und w�re f�r jeden Lexer ein anderer, also f�r jeden Zeichensatz und jede Iteratordarstellung. Da stellt sich nat�rlich die Frage, was denn der Parser mit dem Lexer zu tun hat. Den Parser geht ja nur der Typ der Token (enum class token::token_type) etwas an. Das Problem ist dann aber die Symboltabelle. Daf�r k�nnte der Parser mit einer Basisklasse von token_iterator und einer von token arbeiten, welche dann Methoden zum Vergleichen anbieten.
Was mache ich aber, wenn verschiedene Zeichens�tze gleichzeitig unterst�tzt werden sollen, z. B. eine Quelldatei eine andere mit einem anderen Zeichensatz einbindet, und dann erwartet, Symbole aus dieser anderen Quelldatei verwenden zu k�nnen? Alles in UCS-2 (oder UTF-8 oder UTF-16) konvertieren?