utf8 pragma
[migration-tools.git] / select_marc.pl
1 #!/usr/bin/perl
2 use open ':utf8';
3 use MARC::Batch;
4 use MARC::Record;
5 use MARC::File::XML ( BinaryEncoding => 'utf-8' );
6 use MARC::Field;
7
8 my $record_id_file = $ARGV[0];
9 my %record_ids;
10
11 open FILE, $record_id_file;
12 while (my $record_id = <FILE>) {
13     chomp($record_id); $record_ids{ $record_id } = 1;
14 }
15 close FILE;
16
17 my $id_tag = $ARGV[1]; my $id_subfield = $ARGV[2];
18
19 binmode(STDOUT, ':utf8');
20 binmode(STDIN, ':utf8');
21
22 foreach $argnum ( 3 .. $#ARGV ) {
23
24         print STDERR "Processing " . $ARGV[$argnum] . "\n";
25
26         my $batch = MARC::Batch->new('XML',$ARGV[$argnum]);
27         $batch->strict_off();
28         $batch->warnings_off();
29
30     my $count = 0;
31
32         while ( my $record = $batch->next() ) {
33
34         $count++;
35
36                 my $id = $record->field($id_tag);
37                 if (!$id) {
38                         print STDERR "ERROR: This record is missing a $id_tag field.\n" . $record->as_formatted() . "\n=====\n";
39                         next;
40                 }
41                 $id = $id->as_string($id_subfield);
42
43         if (defined $record_ids{ $id }) {
44             open FILE, ">$id";
45             binmode(FILE, ':utf8');
46             print FILE $record->as_xml();
47             close FILE;
48         }
49         }
50     print STDERR "Processed $count records.\n";
51 }