2024-11-29 09:08:26 +01:00
4 changed files with 4 additions and 6 deletions
--- a/CHANGELOG.md
+++ b/CHANGELOG.md
@ -16,7 +16,6 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
 well as dcterms.bibliographicCitation) in `experimental.correct_language()`
 - Regular expression to match dc.title and dcterms.title, but
 ignore dc.title.alternative `check.duplicate_items()`
- Missing field name in `fix.newlines()` output

 ## [0.4.7] - 2021-03-17
 ### Changed
--- a/csv_metadata_quality/app.py
+++ b/csv_metadata_quality/app.py
@ -89,7 +89,7 @@ def run(argv):

        # Fix: newlines
        if args.unsafe_fixes:
-            df[column] = df[column].apply(fix.newlines, field_name=column)
+            df[column] = df[column].apply(fix.newlines)

        # Fix: missing space after comma. Only run on author and citation
        # fields for now, as this problem is mostly an issue in names.
--- a/csv_metadata_quality/fix.py
+++ b/csv_metadata_quality/fix.py
@ -180,7 +180,7 @@ def duplicates(field, field_name):
    return new_field


-def newlines(field, field_name):
+def newlines(field):
    """Fix newlines.

    Single metadata values should not span multiple lines because this is not
@ -205,7 +205,7 @@ def newlines(field, field_name):
    match = re.findall(r"\n", field)

    if match:
-        print(f"{Fore.GREEN}Removing newline ({field_name}): {Fore.RESET}{field}")
+        print(f"{Fore.GREEN}Removing newline: {Fore.RESET}{field}")
        field = field.replace("\n", "")

    return field
--- a/tests/test_fix.py
+++ b/tests/test_fix.py
@ -76,9 +76,8 @@ def test_fix_newlines():

    value = """Ken
 ya"""
-    field_name = "dcterms.subject"

-    assert fix.newlines(value, field_name) == "Kenya"
+    assert fix.newlines(value) == "Kenya"


 def test_fix_comma_space():