Mageia Forum

Uživatelské aplikace => Kancelářské aplikace => Téma založeno: LUTEC Října 17, 2012, 21:29:24

Název: jak dostat text z fotky
Přispěvatel: LUTEC Října 17, 2012, 21:29:24
Mam ofocenou prirucku a potreboval bych nektere odstavce prekopirovat jako text. Je to mozne nejak uskutecnit? Nemate s tim nekdo zkusenost?
Název: Re:jak dostat text z fotky
Přispěvatel: Rellik Října 17, 2012, 21:37:46
Mělo by to jít nějakou OCR čtečkou. Otázka ale je, jestli nějaká taková v linuxu existuje. Když sem ještě používal win, tak na to byl supr program Abbyy Fine Reader. Umí dekódovat text i grafiku v podstatě z čehokoliv i když je spíše zaměřen pro práci s PDF.
Název: Re:jak dostat text z fotky
Přispěvatel: antkrc Října 18, 2012, 19:00:53
Citace
Mělo by to jít nějakou OCR čtečkou. Otázka ale je, jestli nějaká taková v linuxu existuje.
V repozitáři Mageii jsem našel gocr a ocrfeeder.

O ocrfeeder je článek na stránce http://www.linuxexpres.cz/software/ocrfeeder-uzitecny-rozpoznavac-textu-ktery-vsak-neumi-cesky
Snad ti to nějak pomůže.
Název: Re:jak dostat text z fotky
Přispěvatel: LUTEC Října 23, 2012, 22:02:25
Jo diky, ale ocrfeeder jsem nainstaloval a nejde mi spustit.
Název: Re:jak dostat text z fotky
Přispěvatel: Peťoš Října 23, 2012, 22:06:13
Jo diky, ale ocrfeeder jsem nainstaloval a nejde mi spustit.
Nefunguje mi auto. Neco jsem vymenil. A nefunguje to dal... Myslis, ze vis, co s tim je?
prelozim ti to: jak jsi to nainstaloval, co to pise pri spusteni, neboli JAK to nefunguje? Co vypis z terminalu?
Název: Re:jak dostat text z fotky
Přispěvatel: Peťoš Října 25, 2012, 11:51:37
Pro LUTECa a jemu podobnym: http://wiki.mageia.cz/wiki:jak_se_ptat_na_foru
Název: Re:jak dostat text z fotky
Přispěvatel: LUTEC Října 26, 2012, 22:41:04
Nefunguje mi auto. Neco jsem vymenil. A nefunguje to dal... Myslis, ze vis, co s tim je?
prelozim ti to: jak jsi to nainstaloval, co to pise pri spusteni, neboli JAK to nefunguje? Co vypis z terminalu?

Pokud budes mit nekdy opravdu problem s autem, tak ti rad pomohu. Ohledne meho problemu:

Nainstaloval jsem OCRFEEDER z repozitaru a pri spusteni z grafiky mi tam chvili skace ozubene kolecko a nic jineho se nedeje a i to po chvili zmizi a z terminalu mi vyskoci nasledujici hlaska.
Název: Re:jak dostat text z fotky
Přispěvatel: Yullaw Října 27, 2012, 11:25:24
Ano, potvrzuji také, že z oficiálních zdrojů Mageii 2 se program ocrfeeder-0.7.7-1.mga2.noarch nespustí, výpis z konzole:

Kód: [Vybrat]
[yullaw@localhost ~]$ ocrfeeder

** (process:9219): WARNING **: Trying to register gtype 'GMountMountFlags' as enum when in fact it is of type 'GFlags'

** (process:9219): WARNING **: Trying to register gtype 'GDriveStartFlags' as enum when in fact it is of type 'GFlags'

** (process:9219): WARNING **: Trying to register gtype 'GSocketMsgFlags' as enum when in fact it is of type 'GFlags'
Traceback (most recent call last):
  File "/usr/bin/ocrfeeder", line 31, in <module>
    from ocrfeeder.studio.studioBuilder import Studio
  File "/usr/lib/python2.7/site-packages/ocrfeeder/studio/studioBuilder.py", line 26, in <module>
    import widgetPresenter
  File "/usr/lib/python2.7/site-packages/ocrfeeder/studio/widgetPresenter.py", line 28, in <module>
    from enchant.checker import SpellChecker
ImportError: No module named enchant.checker
[yullaw@localhost ~]$

Řešení je v doinstalováním balíčku python-enchant (pro jistotu zkontrolovat i nainstalovaný balíček python-gtkspell). Po spuštění programu příkazem ocrfeeder již naběhne okno, kde můžete pracovat s dokumenty.

Kód: [Vybrat]
$IMAGE $FILE -l ces; cat $FILE.txt; rm $FILE

Rád bych ještě zde doplnil informaci o dalším programu YAGF (http://symmetrica.net/cuneiform-linux/yagf-en.html), ten ale není v oficiálních repozitářích (ale vím kde :D ).


EDIT: - doplnění odkazu potřebného archivu ces.traineddata.gz; překlep
Název: Re:jak dostat text z fotky
Přispěvatel: Ivko Října 27, 2012, 11:33:48
Rád bych ještě zde doplnil informaci o dalším programu YAGF (http://symmetrica.net/cuneiform-linux/yagf-en.html), ten ale není v oficiálních repozitářích (ale vím kde :D ).

Kde?
Název: Re:jak dostat text z fotky
Přispěvatel: Yullaw Října 27, 2012, 11:47:06
Kde?

Hledej šmudlo: blogDrake
Název: Re:jak dostat text z fotky
Přispěvatel: LUTEC Října 29, 2012, 09:10:31
Dekuji za navod uz funguju, ohledne toho programu YAGF, prijde ti lepsi presnejsi?
Název: Re:jak dostat text z fotky
Přispěvatel: Yullaw Října 29, 2012, 16:54:10
YAGF, prijde ti lepsi presnejsi?

yagf a ocrfeedeer mohou použít výkonový program tesseract či guneiform (ten v repozitářích není dostupný).

Co jsem postřehl při testech (s použitím tesseract):
YAGF (http://symmetrica.net/cuneiform-linux/yagf-en.html): ocrfeeder (https://live.gnome.org/OCRFeeder):
Suma sumárum: z mého hlediska je program ocrfeeder vítězem...

Recenze obou programů najdete v openMagazínu 2012-04 (http://www.openmagazin.cz/pdf/2012/openMagazin-2012-04.pdf) na straně 4 (ocrfeeder) a straně 20 (yagf).
Název: Re:jak dostat text z fotky
Přispěvatel: LUTEC Října 30, 2012, 00:21:55
Ja za sebe mohu rict, ze s OCRFEEDER jsem zatim spokojen, pouzivam ho na text z naskenovane knihy, ktera neni v prilis dobre kvalite a slova sklada tak s 90% presnosti.
Název: Re:jak dostat text z fotky
Přispěvatel: Yullaw Října 30, 2012, 06:38:12
ocrfeeder (https://live.gnome.org/OCRFeeder):
  • - pro rozeznání češtiny je potřeba doinstalovat (manuálně) soubor ces.traineddata

Pro Mageiu 3 jsou jiz pripraveny balicky tesseractu s cestinou i slovenstinou (a mnoho dalsich jazyku), takze manualni presouvani souboru odpada a vse bude automaticke vyberem ;)
Název: Re:jak dostat text z fotky
Přispěvatel: starsi Července 23, 2013, 16:59:16
Nainštaloval som OCRFeeder bohužial nešiel spustiť.
dalo mi to tento výpis:

[miro@localhost ~]$ ocrfeeder
Gtk-Message: Failed to load module "canberra-gtk-module"
Traceback (most recent call last):
  File "/usr/bin/ocrfeeder", line 31, in <module>
    from ocrfeeder.studio.studioBuilder import Studio
  File "/usr/lib/python2.7/site-packages/ocrfeeder/studio/studioBuilder.py", line 21, in <module>
    from ocrfeeder.util import lib
  File "/usr/lib/python2.7/site-packages/ocrfeeder/util/lib.py", line 31, in <module>
    from lxml import etree
ImportError: No module named lxml
[miro@localhost ~]$

vôbec neviem čo s tým  :(
Název: Re:jak dostat text z fotky
Přispěvatel: lukas.v1 Července 23, 2013, 19:45:00
Nainstaluj balík canberra-gtk.

Viz chybová zpráva programu:
Gtk-Message: Failed to load module "canberra-gtk-module"

Balík jsem hledal pomocí příkazu:
Kód: [Vybrat]
urpmq -y canberra
Název: Re:jak dostat text z fotky
Přispěvatel: starsi Července 24, 2013, 00:22:33
nepomohlo výpis rovnaký
Název: Re:jak dostat text z fotky
Přispěvatel: Peťoš Července 24, 2013, 08:06:15
Co presne jsi udelal? Dej do terminalu:
Kód: [Vybrat]
rpm -qa | grep -i canberra
Název: Re:jak dostat text z fotky
Přispěvatel: starsi Července 24, 2013, 11:49:52
[root@localhost miro]# rpm -qa | grep -i canberra
lib64canberra-gtk3_0-0.30-2.mga3
canberra-common-0.30-2.mga3
lib64canberra0-0.30-2.mga3
canberra-gtk-0.30-2.mga3
[root@localhost miro]#
Název: Re:jak dostat text z fotky
Přispěvatel: lukas.v1 Července 24, 2013, 16:39:51
Já mám ještě jeden nainstalovaný balík nejspíš jako závislost pro jiný program: lib64canberra-gtk0
Tento balík není uvedený v závislostech pro canberra-gtk.

OCRFeeder jsem nyní nainstaloval a jde spustit.
Název: Re:jak dostat text z fotky
Přispěvatel: starsi Července 25, 2013, 10:11:17
Doinštaloval som aj ten lib64canberra-gtk0 ale nepomohlo nejde spustiť. Tu je výpis

[root@localhost miro]# rpm -qa | grep -i canberra
lib64canberra-gtk3_0-0.30-2.mga3
canberra-common-0.30-2.mga3
lib64canberra-gtk0-0.30-2.mga3
lib64canberra0-0.30-2.mga3
canberra-gtk-0.30-2.mga3
[root@localhost miro]#
Název: Re:jak dostat text z fotky
Přispěvatel: lukas.v1 Července 25, 2013, 18:25:12
A píše stále stejnou chybu?
Název: Re:jak dostat text z fotky
Přispěvatel: starsi Července 25, 2013, 22:49:32
ano