Konuyu görüntüle
IUCODERS FORUM > Programlama > .NET > Word (.doc) dosyası okumak?
Yazar
clairvoyant


avatar
Antalya
Kayıt: 05.05.2006
05.12.2010-13:59 #72170
Merhaba,

Bir .doc (Word 2003) dosyasındaki text veriyi ayıklayan bir kod parçasına ihtiyacım var fakat .NET platformuna yabancıyım. Bunu yapabilmek için illa ki COM referansı eklemek zorunda mıyım? Makinede MS Office yazılımı yüklü olması gerekiyor mu?
Yardımda bulunabilecek arkadaşlara şimdiden teşekkür ederim.





Let`s make this world a better place to live !

Yazar
wardom


avatar
Kirklareli
admin
Kayıt: 12.11.2006
05.12.2010-14:50 #72171
Şafak ayıklamaktan kastın text okuma ve bulmak ise şu linklere göz atabilirsin. Microsoft Word 11.0 Object Library'yi ekleyerek te halledebilirsin diye düşünüyorum.

http://www.burakaydin.tk/c-word-dosyasini-okuma-ve-icerisinde-kelime-aratma
http://www.codeproject.com/KB/aspnet/wordapplication.aspx






www.sonergonul.net





Yazar
clairvoyant


avatar
Antalya
Kayıt: 05.05.2006
05.12.2010-18:33 #72174
Teşekkür ederim. COM bileşeni yardımıyla dosyayı okuyabiliyorum, fakat anladığım kadarıyla yalnızca MS Office yüklü olan makinelerde çalışıyor bu yöntem. Bunun başka bir yolu yok mudur? Office yüklü olmayan bir serverda .doc dosyalarını bir şekilde okuyabilir miyim?





Let`s make this world a better place to live !

Yazar
orhan


avatar
istanbul
admin
Kayıt: 17.11.2005
05.12.2010-22:14 #72175
sanırım oyle bi olay yok. office componentlerinin yuklu olması gerekio.
java ile bişeyler yapma şansın varsa o yolu bir deneyebilirsin.





N/A
Yazar
fenerista


avatar
Istanbul
Kayıt: 27.11.2006
06.12.2010-08:39 #72178
Poi kütüphanesiyle javada çok basit.

http://poi.apache.org/




  
import org.apache.poi.poifs.filesystem.*;
import org.apache.poi.hwpf.*;
import org.apache.poi.hwpf.extractor.*;
import java.io.*;

..
 private String readDocFile(File file)
    {
        
        POIFSFileSystem fs = null;
        try
        {
          fs = new POIFSFileSystem(new FileInputStream(file));
          HWPFDocument doc = new HWPFDocument(fs);
          WordExtractor we = new WordExtractor(doc);
          readedText = we.getText();

        }
        catch(Exception e) {
            e.printStackTrace();
        }

          return readedText;
    }


ama diğer bazı kütüphaneler de gerekebilir Benim eklediklerim şunlarmış :

poi,
poi-scratchpad,
poi-contrib,
poi-examples,
poi-ooxml,
poi-ooxml-schemas

hepsi 3.6 versiyonu

javayla yaparsa poi-bin-version.zip i indirip tüm kütüphaneleri ekle içinde var hepsi







Oktay,
Thk you!





Yazar
cantur


avatar
Rize
admin
Kayıt: 16.01.2006
06.12.2010-15:57 #72186
clairvoyant yazdi
 
Teşekkür ederim. COM bileşeni yardımıyla dosyayı okuyabiliyorum, fakat anladığım kadarıyla yalnızca MS Office yüklü olan makinelerde çalışıyor bu yöntem. Bunun başka bir yolu yok mudur? Office yüklü olmayan bir serverda .doc dosyalarını bir şekilde okuyabilir miyim?


Şöle bir şeyle karşılaştım nette. Kendim incelemedim ama işini görecektir sanırım.

http://docx.codeplex.com/





Yazar
clairvoyant


avatar
Antalya
Kayıt: 05.05.2006
08.12.2010-23:34 #72230
Teşekkürler... Ben .doc okumaktan vazgeçtim, sadece .docx ile ilgileneceğim. Word 2003 kullanan kalmasın artık, hep biz yüz veriyoruz diye kullanıyorlar zaten :)





Let`s make this world a better place to live !

Del.icio.us
Digg
Facebook
Furl
Google
Blink
Simpy
Spurl
Y! MyWeb