utf8 pragma
[migration-tools.git] / trim_marc_based_on_tag_subfield_value.pl
1 #!/usr/bin/perl
2 use open ':utf8';
3 use MARC::Batch;
4 use MARC::File::XML ( BinaryEncoding => 'utf-8' );
5 use MARC::Field;
6 use Unicode::Normalize;
7
8
9 my $tag_number = $ARGV[0];
10 my $tag_subfield = $ARGV[1];
11 my $tag_value = $ARGV[2];
12
13 my $count = 0;
14
15 binmode(STDOUT, ':utf8');
16 binmode(STDIN, ':utf8');
17
18 foreach $argnum ( 3 .. $#ARGV ) {
19
20         print STDERR "Processing " . $ARGV[$argnum] . "\n";
21
22         my $batch = MARC::Batch->new('XML',$ARGV[$argnum]);
23         $batch->strict_off();
24         $batch->warnings_off();
25
26         while ( my $record = $batch->next() ) {
27
28         $count++;
29
30                 print STDERR "WARNINGS: Record $count : " .  join(":",@warnings) . " : continuing...\n" if ( @warnings );
31
32         my $keep_me = 0;
33
34         my @tags = ();
35                 my @tags; if ($record->field($tag_number)) { @tags = $record->field($tag_number); }
36                 foreach my $f ( @tags ) { 
37             if ($f->subfield($tag_subfield)) { 
38                 if ( $f->subfield($tag_subfield)=~ m/($tag_value)/i ) { $keep_me = 1; } 
39             } 
40         }
41
42         if ($keep_me) {
43             print STDOUT $record->as_xml();
44         }
45
46         }
47         print STDERR "Processed $count records\n";
48 }