Papierdokumente übersetzen
- baufred
- especialista

- Beiträge: 2812
- Registriert: Fr 18. Jun 2010, 17:24
- Wohnort: Wolfsburg/San Fulgencio Urb. La Marina
Papierdokumente übersetzen
Fragestellung: wie bekomme ich bei nicht ausreichenden Sprachkentnisse Dokumente kostenlos und mit geringem Aufwand
in die jeweilige gewünschte Sprache übersetzt - ... hier: mal als "Generalprobe" und 1. Versuch gestern und heute 'ne kleine Fleißarbeit ... für den Behörden"kram" in Spanisch:
Aufgabe: 15-seitiges dtsch. "Papier"-Protokoll eines Asylanten"interviews" vor einer Bundesbehörde für die Antragsteller als Ablagedoku und zur Erinnerung in die spanische Sprache zu übersetzen.
Basisvoraussetzung - in meinem Fall:
PC mit Linux Mint (64bit)
Scanner m. Linux-Software > simple Scan
OCR-Programm > Tesseract-ocr mit "Oberfläche" > Gimagereader aus dem Linux-Softwareshop (alles gratis)
libreOffice
Übersetzung mit deepL (Online)
Vorgehensweise
> Blätter in richtiger Reihenfolge nacheinander mit simpleScan einscannen > als gemeinsamer Vorgang und abspeichern aller Blätter in eine einzige PDF-Datei
> OCR-Programm > Tesseract-ocr mit "Oberfläche" > Gimagereader starten und PDF-Datei aufrufen, Bearbeitungsabschnitte (Icon lks. neben Sprachauswahl), Sprache auswählen und starten ... rechts im "Output"fenster erscheint dann der erkannten Text ... alles markiern, kopieren und in libreOffice (Writer) einfügen
> libreOffice: den Text ggfs. korrigieren (ab und an können Buchstaben-Lesefehler und Ähnliches auftauchen), Textblöcke ggfs. temporär durch Setzen eines neuen Zeilenumbruch trennen zum Erkennen und Deaktivieren versteckter Zeilenumbrüche, um einen fortlaufenden Textfluß im Absatz zu erhalten - gewünschte Zeilenumbrüche ggfs. neu setzen - wenn das nicht überarbeitet wird, sind später bei der Übersetzung unerwünschte Effekte in der Textformatierung die Folge. Den überarbeiteten und neu formatierten Text dann als *.docx-Format abspeichern.
> deepL im Browser öffnen und die Option "Dateien übersetzen" wählen und mit "Datei auswählen" die vorher abgespeicherte *.docx-Datei auf dem Rechner auswählen und hochladen, im rechten Fenster die "Zielsprache" auswählen und rechts unten "Übersetzen" anklicken ... die Übersetzung erscheint dann dort als entsprechende "Word-Datei" im *.docx-Format zum Download auf den Rechner.
> libreOffice: die v.g. abgespeicherte Datei zum evtl. "optischen" Nachbearbeiten öffnen bzw. neu abspeichern.
Ergebnis (nach 3 Std. Fleißarbeit): ich war angenehm überrascht, über die Qualität der Übersetzung mit den entsprechenden Fachbegriffen und der grammatikalisch richtigen Satzbildung ... auch bei "verschachtelten" Sätzen
... zu deepL: kostenlos sind so pro Monat 3 umfangreiche Übersetzungen per Datei möglich - weitere Infos dazu auf der HP unten.
... also keine Angst ... mit der entsprechenden techn. Ausrüstung ist das problemlos für den Einen oder die Andere möglich ...
in die jeweilige gewünschte Sprache übersetzt - ... hier: mal als "Generalprobe" und 1. Versuch gestern und heute 'ne kleine Fleißarbeit ... für den Behörden"kram" in Spanisch:
Aufgabe: 15-seitiges dtsch. "Papier"-Protokoll eines Asylanten"interviews" vor einer Bundesbehörde für die Antragsteller als Ablagedoku und zur Erinnerung in die spanische Sprache zu übersetzen.
Basisvoraussetzung - in meinem Fall:
PC mit Linux Mint (64bit)
Scanner m. Linux-Software > simple Scan
OCR-Programm > Tesseract-ocr mit "Oberfläche" > Gimagereader aus dem Linux-Softwareshop (alles gratis)
libreOffice
Übersetzung mit deepL (Online)
Vorgehensweise
> Blätter in richtiger Reihenfolge nacheinander mit simpleScan einscannen > als gemeinsamer Vorgang und abspeichern aller Blätter in eine einzige PDF-Datei
> OCR-Programm > Tesseract-ocr mit "Oberfläche" > Gimagereader starten und PDF-Datei aufrufen, Bearbeitungsabschnitte (Icon lks. neben Sprachauswahl), Sprache auswählen und starten ... rechts im "Output"fenster erscheint dann der erkannten Text ... alles markiern, kopieren und in libreOffice (Writer) einfügen
> libreOffice: den Text ggfs. korrigieren (ab und an können Buchstaben-Lesefehler und Ähnliches auftauchen), Textblöcke ggfs. temporär durch Setzen eines neuen Zeilenumbruch trennen zum Erkennen und Deaktivieren versteckter Zeilenumbrüche, um einen fortlaufenden Textfluß im Absatz zu erhalten - gewünschte Zeilenumbrüche ggfs. neu setzen - wenn das nicht überarbeitet wird, sind später bei der Übersetzung unerwünschte Effekte in der Textformatierung die Folge. Den überarbeiteten und neu formatierten Text dann als *.docx-Format abspeichern.
> deepL im Browser öffnen und die Option "Dateien übersetzen" wählen und mit "Datei auswählen" die vorher abgespeicherte *.docx-Datei auf dem Rechner auswählen und hochladen, im rechten Fenster die "Zielsprache" auswählen und rechts unten "Übersetzen" anklicken ... die Übersetzung erscheint dann dort als entsprechende "Word-Datei" im *.docx-Format zum Download auf den Rechner.
> libreOffice: die v.g. abgespeicherte Datei zum evtl. "optischen" Nachbearbeiten öffnen bzw. neu abspeichern.
Ergebnis (nach 3 Std. Fleißarbeit): ich war angenehm überrascht, über die Qualität der Übersetzung mit den entsprechenden Fachbegriffen und der grammatikalisch richtigen Satzbildung ... auch bei "verschachtelten" Sätzen
... zu deepL: kostenlos sind so pro Monat 3 umfangreiche Übersetzungen per Datei möglich - weitere Infos dazu auf der HP unten.
... also keine Angst ... mit der entsprechenden techn. Ausrüstung ist das problemlos für den Einen oder die Andere möglich ...
Saludos -- baufred --
Re: Papierdokumente übersetzen
Tesseract OCR liefert tatsächlich brauchbare Ergebnisse. Ich hatte letztens die Aufgabe, aus Papierseiten durchsuchbares PDF zu erstellen (Gerichtsanforderung). Da gibt es Kaufware von Adobe natürlich oder eben Tesseract.
Gruß // Housecat
Gruß // Housecat
- Rockcrunsher
- apasionado

- Beiträge: 685
- Registriert: Di 12. Jun 2018, 08:36
- Wohnort: Ulm/Esslingen/Oliva
- Kontaktdaten:
Re: Papierdokumente übersetzen
@Baufred:
Absolut klasse gemacht. Das werde ich auch mal so ausprobieren. Einzig der Scanner könnte für manche ein Problem werden.
Absolut klasse gemacht. Das werde ich auch mal so ausprobieren. Einzig der Scanner könnte für manche ein Problem werden.
Liebe Grüße
Rockcrunsher
Rockcrunsher
-
Miesepeter
- especialista

- Beiträge: 4114
- Registriert: Mi 8. Jun 2016, 10:45
- Wohnort: S.O.-Spanien
Re: Papierdokumente übersetzen
Als "Zeitvertreib" akzeptabel, wobei man je nach verfügbarem Computersystem mglw. an den Rand der Verzweiflung gebracht werden kann, aber ein Lernprozess ist ja dazu da, denn er verringert den Begriff "unzureichend". Für normale Texte ist das Vorgehen ausreichend, bei Dokumenten im Allgemeninen und öffentlichen im Besonderen würde ich jedoch sehr vorsichtig sein, sowie wenn diese beeidigt werden sollen, ganz davon abraten. Behörden haben ihre eigene Sprache, Begriffe und deren Auslegung. Kleines Beispiel: auf die Frage (vor vielen Jahren) nach meiner Schulbildung gab ich wahrheitsgemäß "Gimnasio" (Gymnasium) an und löste damit etwas Befremdung aus, denn der Spanier versteht darunter "Turnhalle".
Der Intellekt steht nachgeordnet zum Willen (Briefträger Gert Postel)
Reichtum ist die Fähigkeit, das Leben voll auszukosten (H. D. Thoreau)
Vorsicht bei Wünschen, sie können erfüllt werden - eigene Erfahrung
Reichtum ist die Fähigkeit, das Leben voll auszukosten (H. D. Thoreau)
Vorsicht bei Wünschen, sie können erfüllt werden - eigene Erfahrung
- baufred
- especialista

- Beiträge: 2812
- Registriert: Fr 18. Jun 2010, 17:24
- Wohnort: Wolfsburg/San Fulgencio Urb. La Marina
Re: Papierdokumente übersetzen
... zum Thema Scanner:Rockcrunsher hat geschrieben: ↑So 3. Apr 2022, 08:31 ... Einzig der Scanner könnte für manche ein Problem werden.
vor Neukauf (alter Scanner > 20 Jahre + ohne USB-Anschluss!>entsorgt) I-net Info zu Kompatibilitäten verschiedener Hersteller m. Linux abgefragt ...
>> Ergebnis: Canon Lide 220 - vor etwa 4 Jahren für ca. 80,- € gekauft und problemlos eingerichtet - Auflösung bis 4800dpi
1 Jahr später für Spanien noch das Vorgängermodell Lide 110 auf dem Flohmarkt für 8,- € gekauft - funktioniert ebenfalls problemlos ...
... und, wenn das Originaldokument "sauber", "scharf" und "fleckenfrei" vorliegt, ist das Scan-Ergebnis nahezu perfekt!
@ Miesepeter: und, natürlich sollte man das Ergebnis an Hand z.B. einiger Fachbegriffe schon überprüfen - auch meine spanischen Vokabel- u. Grammatikkenntnisse sind soweit ausreichend, um einen Qualitätsquercheck der Übersetzung zu erlauben
Saludos -- baufred --
Re: Papierdokumente übersetzen
Äh, nein. Multifunktions-Tintendrucker (DruckScanKopierer) mit USB sind unter Linux normalerweise kein Problem. Wenn man den Einschalter findet und ggf. den USB-Anschluss herstellen kann. Ein Treiber fürs Scannen wird normalerweise nicht benötigt. Ggf einfach den billigsten gebrauchten HP für 29,-- und losscannen. Tintenpreis für so ein Dings ist ein anderes Thema.Rockcrunsher hat geschrieben: ↑So 3. Apr 2022, 08:31 @Baufred:
Einzig der Scanner könnte für manche ein Problem werden.
Linuxmint herunterladen, auf einen USB Stick übertragen und den PC / Laptop vom USB-Stick starten ist schon etwas schwieriger...
Gruß // Housecat
-
Miesepeter
- especialista

- Beiträge: 4114
- Registriert: Mi 8. Jun 2016, 10:45
- Wohnort: S.O.-Spanien
Re: Papierdokumente übersetzen
Sehr gute und vor allem billige Lösung; CamScanner auf dem Handy mit eingebautem OCR. Sagenhafte Leistung.
Der Intellekt steht nachgeordnet zum Willen (Briefträger Gert Postel)
Reichtum ist die Fähigkeit, das Leben voll auszukosten (H. D. Thoreau)
Vorsicht bei Wünschen, sie können erfüllt werden - eigene Erfahrung
Reichtum ist die Fähigkeit, das Leben voll auszukosten (H. D. Thoreau)
Vorsicht bei Wünschen, sie können erfüllt werden - eigene Erfahrung
- Rockcrunsher
- apasionado

- Beiträge: 685
- Registriert: Di 12. Jun 2018, 08:36
- Wohnort: Ulm/Esslingen/Oliva
- Kontaktdaten:
Re: Papierdokumente übersetzen
@housecat:
Ja, da habe ich hier im Forum manchmal ein Problem
Einerseits sind hier Leute, die selbst an einfachen Smartphone-Aufgaben scheitern, andererseits tummeln sich hier Foristen, die dermaßen Freaks auf dem Gebiet der IT sind, dass ich als Softwareingenieur mit ca. 40 Jahren Berufserfahrung wirklich nur noch "Bahnhof" und "Abfahrt" verstehe
Ja, da habe ich hier im Forum manchmal ein Problem
Einerseits sind hier Leute, die selbst an einfachen Smartphone-Aufgaben scheitern, andererseits tummeln sich hier Foristen, die dermaßen Freaks auf dem Gebiet der IT sind, dass ich als Softwareingenieur mit ca. 40 Jahren Berufserfahrung wirklich nur noch "Bahnhof" und "Abfahrt" verstehe
Liebe Grüße
Rockcrunsher
Rockcrunsher
