Haben Sie sich auch schon geärgert, wenn Sie einen längeren Text aus einem PDF-Dokument nach Word kopiert haben? Der Text ist dort kaum les- und fast nicht bearbeitbar:
- Am Ende jeder pdf-Zeile finden Sie in Word einen Absatzumbruch.
- Natürlich werden auch die Silbentrennungen als Bindestriche mit übergeben.
- Schließlich werden noch die Tabulatoren durch entsprechend viele Leerzeichen ersetzt.
So reparieren Sie diese "Fehler":
- Schalten Sie die Anzeige der Ausgeblendeten Formatierungssymbole ein. Symbol:
- Entfernen Sie die Silbentrennungszeichen (Bindestriche):
Da nach jeder Silbentrennung ein Absatzzeichen folgt, das noch dazu unerwünscht ist, ist das Beheben dieses Fehlers nicht allzu schwierig:
- Öffnen
Sie mit + den Dialog Ersetzen.
- Tragen Sie ins Feld Suchen nach: ein: "-^p" (bedeutet: Bindestrich + Absatzzeichen (^h).
- Lassen Sie das Textfeld Ersetzen durch leer und klicken Sie auf Alle ersetzen.
- Ersetzen der überflüssigen Absatzzeichen:
Da ein echter Absatz durch zwei Absatzschaltungen gekennzeichnet ist, gehen wir so vor:
- Wir ersetzen jedes Mehrfachvorkommen von Absatzschaltungen durch zwei Euro-Zeichen (€€)
- Mit + rufen Sie wieder den Dialog Ersetzen auf.
- Diesmal ersetzen wir "^p ^p".
Achtung! Zwischen den beiden Absatzzeichen(^p) muss ein Leerzeichen eingefügt werden, da dieses auch im Word-Text so steht.
- Ersetzen durch: Hier nehmen wir zwei Euro-Zeichen (€€). Es kann aber jede beliebige Zeichenkombination sein, die im Text nicht vorkommt.
- Alle ersetzen.
- Alle Absatzmarken, die jetzt noch vorhanden sind, werden durch ein Leerzeichen ersetzt. Den Vorgang kennen Sie jetzt schon.
- Jetzt müssen wir noch unsere Platzhalter "€€" durch Absatzzeichen"^p" ersetzen
- Zu guter Letzt ersetzen wir noch jede Folge mehrer Leerzeichen durch einen Tabulatur:
- Dazu geben wir im Ersetzen-Dialog ins Textfeld Suchen nach ein : " {2;}" (vor der öffnenden Klammer muss ein Leerzeichen stehen. Der Ausdruck in den geschwungenen Klammern bedeutet, dass das vorhergehende Zeichen mindestens 2x vorkommen muss, um ersetzt zu werden.
- In Ersetzen durch steht "^t" (für einen Tabulator).
- Da wir jetzt mit Platzhaltern arbeiten ("{2;") müssen wir im Dialog noch auf den Schalter Erweitern klicken und dann die Checkbox Platzhalter verwenden aktivieren.
- Noch einmal Alle ersetzen.
Uff! Das war's!
Bei übernommenen Überschriften kann leider immer noch manuelle Nachbearbeitung notwendig sein.
Tipp getestet unter Word 2003, 2007, 2010