Text Mining dan Web Mining

A.Text Mining
Text mining adalah proses semi otomatis penggalian pola(pengetahuan dan informasi yang berguna)dari sejumlah sember data berukuran besar yang tidak terstruktur.Text mining memiliki tujuan yang sama dan proses yang sama dengan data mining. Yang membedakan hanyalah sumber data yang digunakan. Pada data mining data yang digunakan adalah data terstruktur sedangkan dalam text mining data yang digunakan adalah data yang tidak terstruktur berupa teks.Manfaat dari text mining jelas pada area dimana sejumlah besar data tekstual dihasilkan seperti di bidang hukum,pengobatan,keuangan,dll.
Text mining menggunakan natural language processing untuk memasukkan stuktur kedalam kumpulan teks. Natural language processing(NLP) adalah komponen penting dari text mining dan merupakan sub-bidang dari artificial intelligence dan komputasional linguistik.NLP mempelajari masalah dari “understanding”bahasa asli manusia,dengan tampilan konversi gambaran dari bahasa manusia (seperti dokumen tekstual) menjadi representasi yang lebih formal yang lebih mudah untuk dimanipulasi program komputer.
Aplikasi Text Mining
·      Aplikasi Marketing : Text mining dapat digunakan untuk cross-selling dan up-selling dengan menganalisis data yang tidak terstruktur  yang dihasilkan oleh call center.
·      Aplikasi Kemanan  : Pada tahun 2007 ,EUROPOL mengembangkan sistem terintegrasi  yang mampu mengakses ,memyimpan dan menganalisis sejumlah besar sumber data terstruktur dan tak terstruktur untuk melacak organisasi kriminal transnasional.
·      Aplikasi Biomedis  : PubGene yang menggabungkan text mining biomedis dengan visualisasi jaringan sebagai sebuah layanan Internet. Contoh lainnya yaitu GoPubMed Semantic similarity yang  juga telah digunakan oleh sistem text mining, yaitu, GOAnnotato.
·      Aplikasi Akademik            : National Centre for Text Mining yang merupakan hasil kolaborasi Universitas Manchester dan Liverpool,digunakan untuk menyediakan customized tools,fasiitas penelitian ,dan saran pada text mining untuk komunitas akademik.
Proses Text Mining
Inputan dari proses text mining berupa kumpulan data terstruktur maupun tidak terstruktur. Sedangkan outputnya merupakan pengetahuan berkonteks khusus yang dapat digunakan untuk mengambil keputusan.Kontrol atau hambatan prosesnya mencakup keterbatasan hardware, masalah privasi,kesulitan pemrosesan teks yang ditampilkan dalam bentuk natural language. Mekanisme proses termasuk teknik yang tepat,peralatan software,dan domain keahlian. Pada level yang sangat tinggi proses text mining dapat dipecah menjadi 3 task yaitu :
1)   Membentuk Korpus : Bertujuan mengumpulkan semua dokumen yang berhubungan dengan konteks yang sedang dipelajari. Setelah dikumpulkan,dokumen-dokumen teks di ubah dan diorganisir dalam suatu bentuk sehingga dokumen-dokumen tersebut berada dalam bentuk representasi yang sama.
2)   Menciptakan term-document matrix : Pada tahap ini,pendigitalan dan peorganisasian dokumen (korpus) digunakan untuk menciptakan term-document matrix (TDM).Tujuan utama tahap ini adalah menkonvert daftar dokumen yang terorganisir kedalam TDM dimana sel-sel nya berisi indeks yang paling tepat.
3)   Menggali pengetahuan : text mining menggunakan data mining algoritma seperti klasifikasi,clustering,assosiasi,dan sequence discovery untuk menggali pengetahuan dari algoritma tersebut.
Text Mining Tools
·      Commercial Software Tools : ClearForest,IBM Intelligent Miner Data Mining Suite,Megaputer Text Analyst ,SAS Text Miner,SPSS Text Mining,The Statistica Text Mining,VantagePoint,The WordSTat Analysis module,dll.
·      Free Software Tools : bersifat open source diantranya GATE,LingPipe,S-EM(Spy-EM) dan Vivisimo/Clusty.

B.Web Mining
Web mining adalah proses menemukan hubungan intrinsik dari data web yang diekspresikan dalam bentuk tekstual ,linkage atau informasi yang berguna. Web mining dapat didefinisikan sebagai penemuan dan analisis informasi yang menarik dan berguna dari web,mengenai web dan biasanya menggunakan peralatan berbasis web. Berdasarkan analisis target,web mining dapat dibagi menjadi 3 jenis yaitu : Web usage mining, Web content mining dan Web structure mining.
Makalah selengkapnya download Here
Share on Google Plus

About Admin

Penulis merupakan seorang pecinta drama korea dan jepang, menyukai beberapa musik KPOP dan JPOP, pembaca buku-buku self development dan paling suka makan perkedel kentang dan nasi goreng.
    Blogger Comment
    Facebook Comment

1 comments: