Datei nicht verschiebbar wegen Unicode im Dateinamen

German support forum

Moderators: Hacker, Stefan2, white

Post Reply
harzenmoser
Junior Member
Junior Member
Posts: 2
Joined: 2008-04-29, 17:27 UTC

Datei nicht verschiebbar wegen Unicode im Dateinamen

Post by *harzenmoser »

Hallo zusammen

Ich hab ab einer Plattform ein paar (Sach-)Videos heruntergeladen. Dabei ist mir aufgefallen, dass der Uploader sehr spezielle Schriften für den Titel verwendet hat:
𝐋𝐢𝐞𝐬 ~ Ⓛⓘⓠⓤⓘⓓⓞ Globe ~ 𝓑𝓮𝓪𝓽𝓼

Mir war gar nicht bewusst, dass es diese Möglichkeit gibt. Das Problem: Wenn ich nun die Videos mit Total Commander kopieren möchte, erscheint die Meldung "Der Dateiname enthält Zeichen, die vom Ziel nicht unterstützt werden". Und ich sehe auch dass gewisse Buchstaben mit irgendwelchen ASCII Zeichen angezeigt werden.

Also wollte ich easy den Filenamen kopieren und im WordPad einfügen, um die Formatierung zu entfernen. Und siehe da: Auch im WordPad werden diese Schriften angezeigt! Und wenn ich den Text quasi unformatiert wieder im TC-Dateinamen wieder einfüge, bleibt die Formatierung wie gehabt.
Auch mit einem speziellen Tool namens PureText wird der Text nicht "neutralisiert".

Da ich über 200 Videos mit solchen Namen habe, möchte ich die Dateien nicht von Hand umbenennen, was grundstätzlich funktionieren würde. Es muss was mit der Codierung (Zeichencode) zu tun haben. Hab auch schon mit Notepad++ umgewandelt. Oder im Dos-Fenster eingefügt. Nix neutralisiert den Text :cry:
Last edited by harzenmoser on 2020-11-10, 23:21 UTC, edited 1 time in total.
User avatar
milo1012
Power Member
Power Member
Posts: 1158
Joined: 2012-02-02, 19:23 UTC

Re: Dateiname enthält Spezielle Schriften und Formatierungen

Post by *milo1012 »

Das Stichwort lautet hier nicht Schriften, sondern: Unicode.
Auch wenn ich die Möglichkeiten der Kodierung damit durchaus begrüße, wird gerade im Bereich "Titel und Beschreibung von Videos" ziemlich viel Formatierungs-Spaß betrieben, der eben genau solche Probleme bereitet.

Die vermeintlichen Buchstaben "B e a t s" sind letztlich Zeichen und stammen aus dem Block "Mathematische alphanumerische Symbole".
https://de.wikipedia.org/wiki/Unicodeblock_Mathematische_alphanumerische_Symbole
Weil sie eben von Haus aus kursiv aussehen. Bei den anderen Zeichen ist es ähnlich, sie stammen dann wiederum aus anderen Unicode-Blöcken.

Leider gibt es kaum eine umfassende Lösung, die Zeichen in den ASCII-Bereich zu konvertieren, außer jede Menge per Hand zu tippen.
Du könntest mit einem vernünftigen Text-Editor das Ganze in die ANSI-Codepage wandeln. Dann sähe das aber mit der mitteleuropäischen Codepage 1252 so aus:

Code: Select all

???????? ~ ??????? Globe ~ ??????????
(das Fragezeichen sagt: es gibt kein Äquivalent im ANSI-Zeichensatz)
Also Dateiname in die Zwischenablage kopieren, dann z.B. in Notepad2 eine neue Datei anlegen, sicherstellen dass die Kodierung auf ANSI steht, dann den Text einfügen (Notepad++ ähnlich).

Die Frage ist aber viel mehr: welches Ziel ist denn damit gemeint? Fast alle Dateisysteme unterstützen normalerweise Unicode-Zeichen. Beim kopieren von Dateien sollte es also normalerweise keine Probleme geben. Lediglich bei Archiven könnte es Einschränkungen geben (z.B. Standard-Zip, je nach Einstellung im TC).
TC plugins: PCREsearch and RegXtract
User avatar
milo1012
Power Member
Power Member
Posts: 1158
Joined: 2012-02-02, 19:23 UTC

Re: Dateiname enthält Spezielle Schriften und Formatierungen

Post by *milo1012 »

Okay, ich dachte es mir fast schon: da die Betriebssysteme mit ihren APIs (auf die die Texteditoren letztlich aufbauen) immer einige Jahre hinterherhinken, kann mit aktuellen Onlinetools tatsächlich etwas erreichen.
Unicode hat nämlich tatsächlich "Normalisierungstabellen".
https://dencode.com/en/string/unicode-normalization
Dort den Text einfügen, bei NFKD den jetzt bereinigten (normalisierten) Text auswählen, kopieren, fertig.
(NFKD: K wie kompatibel :) )

Auch hier möglich:
https://minaret.info/test/normalize.msp
https://onlineunicodetools.com/normalize-unicode-text
TC plugins: PCREsearch and RegXtract
harzenmoser
Junior Member
Junior Member
Posts: 2
Joined: 2008-04-29, 17:27 UTC

Re: Dateiname enthält Spezielle Schriften und Formatierungen

Post by *harzenmoser »

Hi Milo
Ja klar - der Titel war falsch - besser so? :lol:

Ich kann mir vorstellen, dass das Thema inskünftig mehr und mehr aufpoppen wird! Hab vom Uploader der Videos auch den Link für sein Tool erhalten: https:// qaz <dot> wtf/u/ . Meine Meinung: Unnötige Sache! Nur um auf der Videoplattform etwas auffallendere Titel zeigen zu können???

Aber du hast das Tool entdeckt, welches tatsächlich normalisiert! 8) Besten Dank! Da geht es also nicht darum, Formatierungen zu entfernen, sondern Zeichen-Codes umzuwandeln.

Nach langer Zeit mal wieder was neues gelernt :D




URL deaktiviert vom Moderator
User avatar
milo1012
Power Member
Power Member
Posts: 1158
Joined: 2012-02-02, 19:23 UTC

Re: Datei nicht verschiebbar wegen Unicode im Dateinamen

Post by *milo1012 »

Freut mich, dass es hilfreich ist.
Die Frage bleibt aber: an welcher Stelle beim Kopieren sagt TC, dass das Ziel die Dateinamen nicht unterstützt? Also welches Ziel war das in diesem Fall? Die Zeichen sehen zwar ziemlich wüst aus, aber sind immer noch Standard-Unicode, mit denen zumindest NTFS bei mir ohne Probleme klarkommt (uns sollte).
TC plugins: PCREsearch and RegXtract
Post Reply