DocExtract: several improvements
0e5307c7bb7c
Actions

Authored by Alessio Deiana <alessio.deiana@cern.ch> on Jan 24 2013, 18:02.

Description

DocExtract: several improvements

Moves html generation of /textmining to a dedicated template file so that it can be overwritten by INPSIRE

Replaced the [A-Z] with a list of uppercase characters that is computed at load.

We can know check for existing tickets for a given recid. Which means we can always create tickets for extracted references by making sure there is not existing ticket.

Submits a single bibupload task, for a refextract task run instead of one per record.

Signed-off-by: Alessio Deiana <alessio.deiana@cern.ch>
Tested-by: Samuele Kaplun <samuele.kaplun@cern.ch>

Committed

Samuele Kaplun <samuele.kaplun@cern.ch>

Dec 18 2013, 16:21

Parents

R3600:0ba3287c6292: BibFormat: empty record check

Branches

Unknown

Tags

Unknown

Samuele Kaplun <samuele.kaplun@cern.ch> committed R3600:0e5307c7bb7c: DocExtract: several improvements (authored by Alessio Deiana <alessio.deiana@cern.ch>).Dec 18 2013, 16:21

				Path
	M			.gitignore
	M			modules/docextract/etc/collaborations.kb
	M			modules/docextract/etc/report-numbers.kb
	M			modules/docextract/lib/Makefile.am
	M			modules/docextract/lib/authorextract_re.py
	M			modules/docextract/lib/docextract_pdf.py
	M			modules/docextract/lib/docextract_task.py
	A			modules/docextract/lib/docextract_templates.py
	M			modules/docextract/lib/docextract_webinterface.py
	M			modules/docextract/lib/refextract_api.py
	M			modules/docextract/lib/refextract_config.py
	M			modules/docextract/lib/refextract_kbs.py
	M			modules/docextract/lib/refextract_record.py
	M			modules/docextract/lib/refextract_regression_tests.py
	M			modules/docextract/lib/refextract_tag.py
	M			modules/docextract/lib/refextract_task.py