Seite 1 von 1

Importer

Verfasst: 30 Sep 2016 10:10
von archivar
Ich möchte alle Pdfs eines Verezeichnisses einlesen. benutze dazu:

<Setting key="src_file_regex" value=".pdf$"/>

das funktioniert auch.

Nun möchte ich den Dateinamen der aus Irgendwas1_irgendwas2_irgendwas3.pdf besteht so aufteilen das irgendwas1, irgendwas2, irgendwas 3 in den Schlüsselwüörtern steht. Das versuche ich (zumindest einmal für ein "irgendwas" mit folgendem Ausdruck:
<Metadata>
<Setting key="name" value="Schlüsselwörter" />
<Setting key="src_file_regex" value="._.PDF?" />
</Metadata>

Leider bekomme ich die Fehlermeldung. metadaten dürfen nicht leer sein. Auch für .Pdf? funktioniert das nicht.

Ist die Kombination zulässig - was bitte mache ich da falsch?


Danke

archivar

Re: Importer

Verfasst: 04 Okt 2016 17:00
von greif76
Hallo archivar,

das ganze funktioniert folgendermaßen: Zunächst den Dateinnamen zerlegen lassen und die einzelnen Bestandteile unter einem Variablennamen ablegen.
Falls die Datei also
abc_def_ghi.pdf
heißt, muß der src_file_regex so aussehen:

Code: Alles auswählen

<Setting key="src_file_regex" value="^(?<irgendwas1>.*)_(?<igendwas2>.*)_(?<irgendwas3>.*)\.pdf$" />

Danach hat dann die Variable "irgwndwas1" den Wert "abc", "irgendwas2" enthält "def" und "irgendwas3" enthält "ghi".

Beim Setzen der Metadatenfelder können dann die Variablen irgendwas1, irgendwas2 und irgendwas3 entsprechend genutzt werden:

Code: Alles auswählen

<Metadata>
  <Metadata>
    <Setting key="name" value="Schlüsselwörter" /><Setting key="value" value="<?irgendwas1?>" />
  </Metadata>
  <Metadata>
    <Setting key="name" value="Beschreibung" /><Setting key="value" value="Dieses Feld ist zusammengesetzte aus <?irgendwas2?> und <?irgendwas3?>" />
  </Metadata>
</Metadata>


Achtung: Ich habe in meinem Beispiel ein zusätzliches Metadatenfeld "Beschreibung" genutzt, welches ich zuvor mit dem Feldmanager erstellt habe.

Damit sollte es klappen.

Gruß
greif76

Re: Importer

Verfasst: 29 Mär 2018 16:53
von impact79
Müssen die "<" und ">" Zeichen nicht erst noch durch "&lt;" und "&gt;" ersetzt werden ?

Re: Importer

Verfasst: 04 Apr 2018 14:16
von mas
impact79 hat geschrieben: 29 Mär 2018 16:53 Müssen die "<" und ">" Zeichen nicht erst noch durch "&lt;" und "&gt;" ersetzt werden ?
Richtig.