Zobacz pełną wersję : Program do porównywania grafiki
tbogdanowicz
04-06-2012, 13:28
Witam wszystkich,
mam pytanie dotyczące bardziej grafiki niż fotografii.
Potrzebuję programu, który jest w stanie porównać fizyczny wygląd dwóch stron zawierających tekst oraz grafikę i stwierdzić czy są identyczne, a jeśli nie zaznaczyć różnice.
Nie chodzi o porównanie treści, ale dokładne porównanie wszystkich elementów typu litery (wraz z kształtem), znaki interpunkcyjne, ozdobniki, tabelki itd. Myślę że po prostu trzeba oba dokumenty zeskanować (potraktować jak grafikę) i porównać. Treść jest nie istotna, to nie są pliki tekstowe do edycji.
Czy istnieje taka możliwość w typowych programach do obróbki zdjęć (Photoshop, Corel itd.), czy też trzeba zakupić coś specjalistycznego???
Bardzo proszę jakiekolwiek informacje.
Proponuję jeszcze bardziej uściślić problem. Co jest dane? Masz pliki w jakimś formacie, czy kartki papieru? Krótko mówiąc, czy istnieje możliwość porównania piksel po pikselu, czy też trzeba wpierw treść dopasować? Czy trzeba ją skalować i obracać? Czy mówimy o danych czarno-białych? I co rozumiesz poprzez oznaczenie? Na przykład pokolorowanie na każdym z obrazów, pikseli czarnych na czerwone, jeżeli nie pasują? A jak jest "A" zamiast "Ą", to ma pokolorować tylko ogonek, czy też szukasz jakiejś inteligencji umiejącej rozpoznać znaki i je odpowiednio potraktować.
Wstępnie przyjrzałbym się programom do OCR, czyli rozpoznawania pisma i nie tylko. Być może wystarczy do tego zadania właśnie skanowanie OCR do dokumentu, a następnie porównanie dwóch dokumentów w jakimś Wordzie. Nie znam tematu, ale to pierwsze, co bym spróbował. Czy to w formacie doc, czy pdf. Nie pamiętam jak się grafika skanowała, ale chyba jako grafika. Wówczas porównanie zapewne nie dotyczyłoby obrazków w sensie wykazania na nich różnic. Natomiast tabelki powinny być rozróżniane bez problemu.
tbogdanowicz
12-06-2012, 10:54
Uściślę.
Dostaję kartkę z tekstem (często również tabelkami) i niewielkimi fragmentami grafiki (Logo firmy, niewielki rysunek będący częścią instrukcji użycia), oraz wzór który mam jako plik *.jpg lub *.pdf. Tekst może być pisany alfabetem łacińskim oraz cyrylicą rosyjską lub ukraińską. Dodam że czasem kolor grafiki też jest istotny.
Kartkę do akceptacji dostarcza drukarnia (pewnie jest to wydruk z ich programu), która na podstawie zatwierdzonego wzoru wykona klika czasem kilkanaście tysięcy wydruków. Z wydruków są również pobierane próbki do kontroli.
Obecnie wszystko mozolnie sprawdza człowiek, ale trwa to dosyć długo. Wiem że są dedykowane urządzenia które wykonują takie rzeczy (pewnie po prostu dobry skaner z oprogramowaniem i najważniejszą rzeczą czyli nazwa wytwórcy:-), która dodaje 500% do wartości :-)), ale są za drogie w stosunku do ilości pracy jaka miałyby wykonywać.
Chodzi głównie o przyśpieszenie sprawdzania tekstów (bywa że czasu jest mało, a teksty miewają po kilka stron cyrlicą), bo koszty przy niewielkiej częstotliwości nie są wysokie.
Z tego co wiem OCR kiepsko się sprawdza więc dedykowane urządzenia, traktują wszystko jako grafikę.
Niestety obawiam się, że prosto nie będzie. OCR do tekstu powinien się nadać całkiem nieźle. To tylko kwestia znalezienia tego właściwego. Grafika i tak jest zamieniana na jakieś wektory. To samo robi oprogramowanie OCR, dodatkowo wiedząc, że to tekst, czyli dając możliwość łatwego zaznaczenia różnic.
No, ale nadal nie wiem, co na przykład z czcionkami. Kroje się różnią, czy muszą być identyczne? Co z grubościami linii, odstępami, czy rozmieszczeniem grafik. Mało danych. Bo jeżeli oba dokumenty mają być identyczne piksel w piksel, to zadanie da się zlecić jakiemuś kumatemu programiście i to zrobi w miarę tanio i może nawet szybko. Natomiast, jeżeli różnice są dopuszczalne, to problem się komplikuje tak, że sprawdzi się wyłącznie jakieś specjalizowane narzędzie, do tego dedykowane. OCR według mnie warto sprawdzić, bo koszt żaden, a może odciążyć człowieka w sporej mierze.
Michał Jędrak
13-06-2012, 22:22
Jedyne co mi przychodzi do głowy to zrobić dwa skany idealnie zeskalować i nałożyć jeden na drugi (na warstwie). Potem włączać i wyłączać warstwę cyklicznie (np sekunda on, sekunda off) i oko od razu wyłapie gdzie coś mruga (brak litery, przesunięte logo, różnice w kolorze itd.)
tbogdanowicz
13-06-2012, 22:48
jeżeli oba dokumenty mają być identyczne piksel w piksel, to zadanie da się zlecić jakiemuś kumatemu programiście i to zrobi w miarę tanio i może nawet szybko. Natomiast, jeżeli różnice są dopuszczalne, to problem się komplikuje tak, że sprawdzi się wyłącznie jakieś specjalizowane narzędzie, do tego dedykowane. OCR według mnie warto sprawdzić, bo koszt żaden, a może odciążyć człowieka w sporej mierze.
Rozmawiałem z kolegą programistą i powiedział nieomal to samo. Twierdzi że gdyby dostał zlecenie to jest w stanie takie coś zrobić. Problem jedynie jest taki że osoba odpowiedzialna za tę pracę (sama tego nie robi) bez wypróbowania nie zgodzi się na zakup. A czegoś czego nie ma nie da się wypróbować :-).
Jeśli chodzi o czcionki i kolory, to muszą się zgadzać ze wzorem, który jest rejestrowany w odpowiednim urzędzie. Inaczej nie byłoby potrzeby aż tak dokładnie sprawdzać.
Być może skończy się że nadal będzie to robione ręcznie/ocznie. Szkoda mi ludzi bo sam to kiedyś musiałem robić i wiem jak wkurzające jest to zajęcie.
tbogdanowicz
13-06-2012, 22:57
Jedyne co mi przychodzi do głowy to zrobić dwa skany idealnie zeskalować i nałożyć jeden na drugi (na warstwie). Potem włączać i wyłączać warstwę cyklicznie (np sekunda on, sekunda off) i oko od razu wyłapie gdzie coś mruga (brak litery, przesunięte logo, różnice w kolorze itd.)
Dopasować idealnie dwa dokumenty nie jest łatwo.
W przypadku druków czarno białych, kolega kiedyś drukował wzory na folii i porównywał z dostarczoną próbką. Było niby szybciej, ale czasem umykały jakieś drobiazgi.
Każde porównywanie wzrokiem jest nużące, co prowadzi do błędów i dla tego zastanawiam się jak zautomatyzować tą pracę.
Michał Jędrak
14-06-2012, 02:32
zastanawiam się jak zautomatyzować tą pracę.
Wynajmij kogoś z Bangladeszu.
Do mnie, na przykład, dzwoniła niedawno firma z Pakistanu z ofertą masowego obrabiania zdjęć...
To się eufemistycznie nazywa outsourcing :-)
tbogdanowicz
14-06-2012, 07:22
Taaa...
Nie wiem jak to wygląda w przypadku fotografii, ale europejski przemysł już tak dużo pracy przekazał do Azji że teraz brakuje zajęcia dla Europejczyków. Kto później ma kupować dobra wytworzone w Azji i przywiezione do Europy, skoro w Europie ludzie potracili pracę? Nie wszyscy mogą być właścicielami firm, które korzystają z outsourcing'u, część musi być pracownikami.
Ale zaraz ktoś powie że jestem zacofany i chcę powstrzymać rozwój firm, albo że jestem rasistą itp. :-).
Powered by vBulletin® Version 4.2.5 Copyright © 2026 vBulletin Solutions, Inc. All rights reserved.