Problem mit Zeichensatz im Lister

German support forum

Moderators: white, Hacker, Stefan2

Franz Müller
Senior Member
Senior Member
Posts: 383
Joined: 2005-05-24, 10:41 UTC
Location: Wien

Problem mit Zeichensatz im Lister

Post by *Franz Müller »

Hallo
Ich habe eine Programmdatei, die im Windows Notepad die Umlaute und das ß korrekt anzeigt. Im Lister des TC wird anstelle der Umlaute irgend ein Mist angezeigt.

Beispiel scharfes ß
Im Lister wird an Stelle des ß das Zeichen ▀ angezeigt, obwohl
laut Hex viewer an der Stelle das Zeichen 0xDF steht,
der Lister auf Courier new eingestellt ist
und laut der Windows Zeichentabelle für Courier new das Zeichen 0xDF dem ß entspricht.

Wie bekomme ich im TC-Lister eine korrekte Anzeige?
User avatar
Dalai
Power Member
Power Member
Posts: 9388
Joined: 2005-01-28, 22:17 UTC
Location: Meiningen (Südthüringen)

Re: Problem mit Zeichensatz im Lister

Post by *Dalai »

Welchen Zeichensatz erkennt denn der Lister, siehe Menü Optionen bzw. Codierung?

Grüße
Dalai
#101164 Personal licence
Ryzen 5 2600, 16 GiB RAM, ASUS Prime X370-A, Win7 x64

Plugins: Services2, Startups, CertificateInfo, SignatureInfo, LineBreakInfo - Download-Mirror
Franz Müller
Senior Member
Senior Member
Posts: 383
Joined: 2005-05-24, 10:41 UTC
Location: Wien

Re: Problem mit Zeichensatz im Lister

Post by *Franz Müller »

Er zeigt den ANSI Zeichensatz an. Aber wenn ich ASCII anwähle, zeigt er genau den gleichen Unsinn an, halt mit einem anderen Font. Auch UTF 8 und Explorervorschau zeigen alle Mist an, nicht den selben Mist, aber auch Mist. Dass unicode nicht gehen kann, ist ohnehin klar.
User avatar
Dalai
Power Member
Power Member
Posts: 9388
Joined: 2005-01-28, 22:17 UTC
Location: Meiningen (Südthüringen)

Re: Problem mit Zeichensatz im Lister

Post by *Dalai »

Wie sieht's denn mit einer anderen Schriftart aus, insbesondere der Standardschrift (Fixedsys)?

Grüße
Dalai
#101164 Personal licence
Ryzen 5 2600, 16 GiB RAM, ASUS Prime X370-A, Win7 x64

Plugins: Services2, Startups, CertificateInfo, SignatureInfo, LineBreakInfo - Download-Mirror
Franz Müller
Senior Member
Senior Member
Posts: 383
Joined: 2005-05-24, 10:41 UTC
Location: Wien

Re: Problem mit Zeichensatz im Lister

Post by *Franz Müller »

Ich habe jetzt die Schriftart auf fixedsys umgestellt, das Problem ist das gleiche wie vorher (ich habe es dann gleich wieder zurück gestellt, aber mit fixedsys sind die angezeigten Zeichen die gleichen.


Image: https://up.picr.de/40271812vn.png
User avatar
Dalai
Power Member
Power Member
Posts: 9388
Joined: 2005-01-28, 22:17 UTC
Location: Meiningen (Südthüringen)

Re: Problem mit Zeichensatz im Lister

Post by *Dalai »

Die gezeigte Darstellung bekomme ich nur hin, wenn ich eine Textdatei mit ANSI-Kodierung im Lister mit ASCII anzeigen lasse (bei dir ist aber eindeutig beides ANSI). Ist das die einzige betroffene Datei oder ist das generell bei allen so? Was passiert, wenn du kleine Teile der Datei in eine neue kopierst und diese im Lister anzeigen lässt?

Grüße
Dalai
#101164 Personal licence
Ryzen 5 2600, 16 GiB RAM, ASUS Prime X370-A, Win7 x64

Plugins: Services2, Startups, CertificateInfo, SignatureInfo, LineBreakInfo - Download-Mirror
User avatar
ghisler(Author)
Site Admin
Site Admin
Posts: 48079
Joined: 2003-02-04, 09:46 UTC
Location: Switzerland
Contact:

Re: Problem mit Zeichensatz im Lister

Post by *ghisler(Author) »

Das liegt höchstwahrscheinlich am Menü "Codierung", dort dürfte "ASCII" ausgewählt sein!
Author of Total Commander
https://www.ghisler.com
Franz Müller
Senior Member
Senior Member
Posts: 383
Joined: 2005-05-24, 10:41 UTC
Location: Wien

Re: Problem mit Zeichensatz im Lister

Post by *Franz Müller »

Ja, stimmt. Danke!
Was bewirkt dann eigentlich die Auswahl Ansi im Menü "Optionen"? Nachdem ich da schon Ansi eingestellt habe, habe ich das Menü Codierung irgendwie übersehen.
User avatar
Hacker
Moderator
Moderator
Posts: 13064
Joined: 2003-02-06, 14:56 UTC
Location: Bratislava, Slovakia

Re: Problem mit Zeichensatz im Lister

Post by *Hacker »

Franz Müller,
Er zeigt den ANSI Zeichensatz an. Aber wenn ich ASCII anwähle, zeigt er genau den gleichen Unsinn an
Ja, stimmt. Danke!
Tja, was denn nun? Der Rat mit ASCII / ANSI kam doch schon vorher.

Roman
Mal angenommen, du drückst Strg+F, wählst die FTP-Verbindung (mit gespeichertem Passwort), klickst aber nicht auf Verbinden, sondern fällst tot um.
gdpr deleted 6
Power Member
Power Member
Posts: 872
Joined: 2013-09-04, 14:07 UTC

Re: Problem mit Zeichensatz im Lister

Post by *gdpr deleted 6 »

Franz Müller wrote: 2021-01-09, 19:06 UTC Was bewirkt dann eigentlich die Auswahl Ansi im Menü "Optionen"? Nachdem ich da schon Ansi eingestellt habe, habe ich das Menü Codierung irgendwie übersehen.
Der Begriff "ANSI" selbst spezifiert nicht wirklich, welche konkrete Zeichenkodierung eigentlich gemeint ist.

Historisch und pedantisch betrachtet, war die ANSI-Zeichenkodierung ein Entwurf des amerikanischen ANSI-Institutes (in etwa equivalent zum deutschen DIN), dass seine Realisierung in den Zeichenkodierungen CP 1252 und ISO/IEC 8859-1 fand. Allerdings haben sich im Lauf der Geschichte regionale/nationale Varianten des originalen ANSI-Entwurfes gebildet, wo halt bestimmte Zeichencodes andere regionale Zeichen darstellen als im originalen, auf amerikanische Beduerfnisse zugeschnittenem ANSI-Entwurf. Einige von diesen - und einige andere Zeichenkodierungen, wo die Mehrzahl an Zeichencodes ein einzelnes Byte benoetigt - wurden als weitere (teilweise erweiterte) Zeichenkodierungen im ISO/IEC 8859-Standard zusammengefasst (der numerische Suffix hinter dem Bindestrich in der Standardnummer ISO/IEC 8859-xx identifiziert die jeweiligen Zeichenkodierungen). Deshalb wurde und wird der Begriff "ANSI-Zeichensatz" bzw. "ANSI-Kodierung" auch haeufig als Gruppenbegriff fuer die im ISO/IEC 8859-Standard zusammengefassten Zeichenkodierungen verwendet.

Mit der Zeit hat sich leider die Interpretation des Sammelbegriffes "ANSI" soweit gedehnt, dass "ANSI" auch oft als Synonym fuer allerlei (regionale) Zeichenkodierungen verwendet, die weder ASCII/Unicode/UTF sind, noch notwendigerweise eine Verwandschaft mit dem ANSI-Entwurf oder den ISO/IEC 8859-Kodierungen haben. Z.B. wird der Begriff "ANSI-Kodierung" als Stellvertreter-Begriff fuer die regionale Codepage in Windows benutzt (verwendet vorwiegend zu Zwecken von Text-basiertem I/O und von alten "Legacy"-Programmen bzw. Programmkomponenten, die nicht mit Unicode umgehen koennen).

Und deshalb, wenn du im Lister-Menu "Optionen" die ANSI-Option auswaehlst, dann ist ja immer noch nicht klar, welche spezifische Zeichenkodierung nun eigentlich verwendet werden soll. Da kommt das "Codierungen"-Menu ins Spiel, mit dessen Hilfe die spezifische Zeichenkodierung ausgewaehlt werden kann. Das "Codierungen"-Menu ist uebrigens auch aktiv, wenn du die "Variable char width"-Option (bzw. deren deutschsprachiges Aequivalent) auswaehlst.
Last edited by gdpr deleted 6 on 2021-01-21, 16:48 UTC, edited 1 time in total.
Franz Müller
Senior Member
Senior Member
Posts: 383
Joined: 2005-05-24, 10:41 UTC
Location: Wien

Re: Problem mit Zeichensatz im Lister

Post by *Franz Müller »

Hacker wrote: 2021-01-09, 21:04 UTC Tja, was denn nun? Der Rat mit ASCII / ANSI kam doch schon vorher.

Roman
Ja. Im Menü Optionen war auch Ansi gewählt. Dass das Ansi an der Stelle keine Wirkung hat, und dass man im Menü Codierung NOCHMAL Ansi einstellen muss, war mir nicht klar. Das ist doppelt gemoppelt und leicht verwirrend. Wozu das Ansi/ASCII im Menü Optionen überhaupt gut ist, verstehe ich nach wie vor nicht.
User avatar
ghisler(Author)
Site Admin
Site Admin
Posts: 48079
Joined: 2003-02-04, 09:46 UTC
Location: Switzerland
Contact:

Re: Problem mit Zeichensatz im Lister

Post by *ghisler(Author) »

Wozu das Ansi/ASCII im Menü Optionen überhaupt gut ist, verstehe ich nach wie vor nicht.
Das ist dafür da, schnell zwischen Ansi, Ascii (beides feste Breite der Zeichen) und variabel umzuschalten, mit A,S und V.
Das Menü Codierung kam erst später dazu, um auch Codierungen aus anderen Sprachregionen anzeigen zu können.
Author of Total Commander
https://www.ghisler.com
Franz Müller
Senior Member
Senior Member
Posts: 383
Joined: 2005-05-24, 10:41 UTC
Location: Wien

Re: Problem mit Zeichensatz im Lister

Post by *Franz Müller »

Verstehe.
Aber nachdem es jetzt das Menü Codierung gibt, scheint die Umschaltung zwischen Ansi und Ascii im Menü Optionen nicht mehr zu funktionieren, oder? Die Schriftart wird umgestellt, aber der Zeichensatz bleibt der gleiche, nämlich der, der im Menü Codierung festgelegt ist, und das ist eigentlich nicht das, was man erwartet, wenn man zwischen ANSI und ASCII wechselt.
User avatar
ghisler(Author)
Site Admin
Site Admin
Posts: 48079
Joined: 2003-02-04, 09:46 UTC
Location: Switzerland
Contact:

Re: Problem mit Zeichensatz im Lister

Post by *ghisler(Author) »

Doch, für den Modus ASCII wird eine andere Schrift benutzt, welche man im Lister über Menü Optionen - Konfigurieren - ASCII wählen kann.
Author of Total Commander
https://www.ghisler.com
User avatar
milo1012
Power Member
Power Member
Posts: 1158
Joined: 2012-02-02, 19:23 UTC

Re: Problem mit Zeichensatz im Lister

Post by *milo1012 »

<offtopic>
elgonzo wrote: 2021-01-10, 18:41 UTC Nunja, ASCII ist eine spezifische, klar definierte Zeichenkodierung bzw. Codepage. Das ist nicht der Fall fuer "ANSI".
Sorry, aber das ist ja nun Quatsch.
Im Gegenteil: ASCII als Bezeichnung für die Codierung sagt erst mal gar nichts über die Zeichen oberhalb von 0x7F, denn der ASCII-Standard legt eben bis heute nur diese berühmten ersten 127/128 Zeichen fest (wegen mir ohne die "non-printable"), die weiteren 127 waren bzw. sind von der "OEM"-Codepage abhängig, also das, was IBM-PCs bzw. deren Klone im DOS bzw. sogar im Grafik-ROM festgelegt hatten. Mich stört ehrlich gesagt schon länger, dass TC hier und an anderen Stellen von ASCII redet, obwohl eigentlich der DOS/OEM-Zeichensatz gemeint ist. Denn genau das ist immer gemeint, weil Windows immer noch neben dem erwähnten ANSI-Zeichensatz auch (aus Kompatibilitätsgründen) die OEM-Codepage in den Regional-Einstellungen definiert und entsprechende API-Funktionen damit anbietet.
Von "DOS/IBM/OEM"-Zeichensatz statt ASCII zu reden wäre also wesentlich sinnvoller und eindeutiger, denn selbst Microsoft bezeichnet es als "OEM".
</offtopic>
TC plugins: PCREsearch and RegXtract
Post Reply