The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Программирование под UNIX (Shell скрипты)
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

разбор двух файлов, Андрей (??), 03-Июл-18, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


9. "разбор двух файлов"  +/
Сообщение от михалыч (ok), 06-Июл-18, 16:30 
ну, что же..
я ждал, но первозданный XML файл так и не показывают

ладно, обойдёмся ))
погнали


#!/usr/bin/perl

use strict;
use warnings;


my $host = "host";
my $ip   = "ip";

open ( FH1, $host ) or die "couldn't open $host : $!";
open ( FH2, $ip )   or die "couldn't open $ip : $!";


my (@hostname, @addr, @short, @proxy, @group, %unic);

{ local $/ = undef;

    while ( <FH1> ) {

        @hostname = m|<host>(.*)</host>|g;
        @addr     = m|<ip>(.*)</ip>|g;
        @short    = m|<name>(.*)</name>|g;
        @proxy    = m|<proxy>.*?>(.*?)</.*?</proxy>|gs;
    }
}

my $count = 0;
while ( <FH2> ) {

    $count++ if /--/;
    if (m|<name>(.*)</name>|) {push @{$group[$count]}, $1 unless $unic{$1}++;}
}

close FH1;
close FH2;

for (my $i=0; $i<@addr; $i++) {

    print "--\n";
    print "hostname: $hostname[$i]\n";
    print "ip: $addr[$i]\n";
    print "short: $short[$i]\n";
    print "proxy: $proxy[$i]\n";
    print "group: ", join(", ", @{$group[$i]}),"\n";
}

комментарии писать лень, и так всё понятно )))

да, можно пойти по пути предложенному ыы


#!/usr/bin/perl

use strict;
use warnings;


undef $/;

my $host = "host";
my $ip   = "ip";

open ( FH1, $host ) or die "couldn't open $host : $!";
open ( FH2, $ip )   or die "couldn't open $ip : $!";


my @hosts = split(/--/, <FH1>);
my @ips   = split(/--/, <FH2>);

close FH1;
close FH2;

my (@hostname, @addr, @short, @proxy, @group, %unic);

for (my $i=0; $i<@hosts; $i++) {

    $hosts[$i] =~ m|<host>(.*)</host>|;
    push @hostname, $1;

    $hosts[$i] =~ m|<ip>(.*)</ip>|;
    push @addr, $1;

    $hosts[$i] =~ m|<name>(.*)</name>|;
    push @short, $1;

    $hosts[$i] =~ m|<proxy>.*>(.*)<.*</proxy>|s;
    push @proxy, $1;

    if ($ips[$i] =~ m|<group>.*?>(.*?)<.*?</group>|s) {push @{$group[$i]}, $1 unless $unic{$1}++;}
    if ($ips[$i] =~ m|<group>.*>(.*)<.*</group>|s) {push @{$group[$i]}, $1 unless $unic{$1}++;}

}

for (my $i=0; $i<$#hosts; $i++) {

    print "--\n";
    print "hostname: $hostname[$i]\n";
    print "ip: $addr[$i]\n";
    print "short: $short[$i]\n";
    print "proxy: $proxy[$i]\n";
    print "group: ", join(", ", @{$group[$i]}),"\n";
}

но есть нюанс )))
цикл while vs цикл for

вспомнился бородатый анекдот про нюанс http://bfy.tw/IvBU

это что так препод садист изголяется??
ух он какой, у-у-ууу..

ps
конечно, цикл for можно переписать по другому, более компактно

for (my $i=0; $i<@hosts; $i++) {

    push @hostname, $1 if $hosts[$i] =~ m|<host>(.*)</host>|;
    push @addr, $1 if $hosts[$i] =~ m|<ip>(.*)</ip>|;
    push @short, $1 if $hosts[$i] =~ m|<name>(.*)</name>|;
    push @proxy, $1 if $hosts[$i] =~ m|<proxy>.*>(.*)<.*</proxy>|s;

    if ($ips[$i] =~ m|<group>.*?>(.*?)<.*?</group>|s) {push @{$group[$i]}, $1 unless $unic{$1}++;}
    if ($ips[$i] =~ m|<group>.*>(.*)<.*</group>|s) {push @{$group[$i]}, $1 unless $unic{$1}++;}

}

такие дела

Ответить | Правка | Наверх | Cообщить модератору

10. "разбор двух файлов"  +/
Сообщение от Pahanivo (ok), 10-Июл-18, 11:36 
Зачем вуду-магия крестянам, Михалыч? Есть же XML парсеры в перле, если не может осилить то онанизм с регексами вокруг XML - это путь в никуда.
Ответить | Правка | Наверх | Cообщить модератору

13. "разбор двух файлов"  +/
Сообщение от михалыч (ok), 10-Июл-18, 19:43 
> Зачем вуду-магия крестянам, Михалыч? Есть же XML парсеры в перле, если не
> может осилить то онанизм с регексами вокруг XML - это путь
> в никуда.

да ладно, что там!
я ж так, для собственного удовольствия ))

видал, тут вообще аноним почти в две строчки уложился, о как!
ну прикольно же!

оно, конечно, может ты и прав, есть и модули для XML
хотя и с ними не всё так просто и однозначно,

но с другой стороны - с регулярками не надо парится,
это как раз на себя и берут эти парсеры (модули)

но ТС зажал исходный XML

а если мы предоставленные файлы возьмём да и чуть-чуть поправим !?
не ну а что? имеет право быть!
сам поломал - сам и починил (но это не точно ))))


#!/usr/bin/perl

use strict;
use warnings;
use XML::LibXML;
use File::Temp qw(tempfile);


my $host = "host";
my $ip   = "ip";

## объявляем массивы для складирования готовой продукции ))
my (@hostname, @addr, @short, @proxy, @group, %unic);

## вспомогательные массивы
my (@f, @f_pre, @f1, @f2);

open ( FH1, $host ) or die "couldn't open $host : $!";
open ( FH2, $ip )   or die "couldn't open $ip : $!";


## исправляем синтаксис XML файлов и сливаем их в один
{local $/ = undef;

    while (<FH1>){
        s|--|</tag>\n<tag>|g;
        @f1 = m|(.*)|s;
    }

    while (<FH2>){
        s|(.*)--|$1</tag>\n</f>|s;
        s|--|</tag>\n<tag>|g;
        @f2 = m|(.*)|s;
    }
}

close FH1;
close FH2;


@f_pre = ("<f>\n<tag>\n");
@f = (@f_pre, @f1, @f2);

## это то, что и будем скармливать модулю XML::LibXML
#print "\n\tthis is a dirty corrected version of the xml file\n\n", @f, "\n\tEOF\n\n\n";


## создаём временный манипулятор и файл (при выходе удаляем его)
my ($fh, $file) = tempfile(UNLINK => 1);

open $fh, ">", $file;
print $fh @f;
close $fh;


## теперь делаем вещи с помощью XPath и метода findnodes

my $parser = XML::LibXML->new;
my $doc    = $parser->parse_file("$file");

my @hostnames = $doc->findnodes("/f/tag/host");
foreach my $hn (@hostnames) {
    push @hostname, $hn->firstChild->data;
}

my @addrs = $doc->findnodes("/f/tag/ip");
foreach my $ad (@addrs) {
    push @addr, $ad->firstChild->data;
}

my @shorts = $doc->findnodes("/f/tag/name");
foreach my $sh (@shorts) {
    push @short, $sh->firstChild->data;
}

my @proxys = $doc->findnodes("/f/tag/proxy/name");
foreach my $pr (@proxys) {
    push @proxy, $pr->firstChild->data;
}

for (my $i=0; $i<@hostname; $i++) {
    my @groups = $doc->findnodes("/f/tag/
        dns[text()='$hostname[$i]']/
        ../group/name/text()");

    foreach my $gr (@groups) {
        push @{$group[$i]}, $gr->data unless $unic{$gr->data}++;

    }
}


for (my $i=0; $i<@hostname; $i++) {

    print "--\n";
    print "hostname: $hostname[$i]\n";
    print "ip: $addr[$i]\n";
    print "short: $short[$i]\n";
    print "proxy: $proxy[$i]\n";
    print "group: ", join(", ", @{$group[$i]}),"\n";
}

да, блин, в попугаях получилось длиннее (((

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру