Ich möchte alle Pdfs eines Verezeichnisses einlesen. benutze dazu:
<Setting key="src_file_regex" value=".pdf$"/>
das funktioniert auch.
Nun möchte ich den Dateinamen der aus Irgendwas1_irgendwas2_irgendwas3.pdf besteht so aufteilen das irgendwas1, irgendwas2, irgendwas 3 in den Schlüsselwüörtern steht. Das versuche ich (zumindest einmal für ein "irgendwas" mit folgendem Ausdruck:
<Metadata>
<Setting key="name" value="Schlüsselwörter" />
<Setting key="src_file_regex" value="._.PDF?" />
</Metadata>
Leider bekomme ich die Fehlermeldung. metadaten dürfen nicht leer sein. Auch für .Pdf? funktioniert das nicht.
Ist die Kombination zulässig - was bitte mache ich da falsch?
Danke
archivar
Importer
Re: Importer
Hallo archivar,
das ganze funktioniert folgendermaßen: Zunächst den Dateinnamen zerlegen lassen und die einzelnen Bestandteile unter einem Variablennamen ablegen.
Falls die Datei also
abc_def_ghi.pdf
heißt, muß der src_file_regex so aussehen:
Danach hat dann die Variable "irgwndwas1" den Wert "abc", "irgendwas2" enthält "def" und "irgendwas3" enthält "ghi".
Beim Setzen der Metadatenfelder können dann die Variablen irgendwas1, irgendwas2 und irgendwas3 entsprechend genutzt werden:
Achtung: Ich habe in meinem Beispiel ein zusätzliches Metadatenfeld "Beschreibung" genutzt, welches ich zuvor mit dem Feldmanager erstellt habe.
Damit sollte es klappen.
Gruß
greif76
das ganze funktioniert folgendermaßen: Zunächst den Dateinnamen zerlegen lassen und die einzelnen Bestandteile unter einem Variablennamen ablegen.
Falls die Datei also
abc_def_ghi.pdf
heißt, muß der src_file_regex so aussehen:
Code: Alles auswählen
<Setting key="src_file_regex" value="^(?<irgendwas1>.*)_(?<igendwas2>.*)_(?<irgendwas3>.*)\.pdf$" />
Danach hat dann die Variable "irgwndwas1" den Wert "abc", "irgendwas2" enthält "def" und "irgendwas3" enthält "ghi".
Beim Setzen der Metadatenfelder können dann die Variablen irgendwas1, irgendwas2 und irgendwas3 entsprechend genutzt werden:
Code: Alles auswählen
<Metadata>
<Metadata>
<Setting key="name" value="Schlüsselwörter" /><Setting key="value" value="<?irgendwas1?>" />
</Metadata>
<Metadata>
<Setting key="name" value="Beschreibung" /><Setting key="value" value="Dieses Feld ist zusammengesetzte aus <?irgendwas2?> und <?irgendwas3?>" />
</Metadata>
</Metadata>
Achtung: Ich habe in meinem Beispiel ein zusätzliches Metadatenfeld "Beschreibung" genutzt, welches ich zuvor mit dem Feldmanager erstellt habe.
Damit sollte es klappen.
Gruß
greif76
Re: Importer
Müssen die "<" und ">" Zeichen nicht erst noch durch "<" und ">" ersetzt werden ?