Pages

12/17/2011

Data Mining


DEFINISI
Data Mining (Penggalian data) adalah ekstraksi pola yang menarik dari data dalam jumlah besar. Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna.
Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan baru. Penggalian data memiliki beberapa nama alternatif, meskipun definisi eksaknya berbeda, seperti KDD (knowledge discovery in database), analisis pola, arkeologi data, pemanenan informasi, dan intelegensia bisnis.
Data mining diperlukan saat data yang tersedia terlalu banyak (misalnya data yang diperoleh dari sistem basis data perusahaan, e-commerce, data saham, dan data bioinformatika), tapi tidak tahu pola apa yang bisa didapatkan.

LATAR BELAKANG
Data Mining (Penggalian data) adalah ekstraksi pola yang menarik dari data dalam jumlah besar. Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna.
Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan baru. Penggalian data memiliki beberapa nama alternatif, meskipun definisi eksaknya berbeda, seperti KDD (knowledge discovery in database), analisis pola, arkeologi data, pemanenan informasi, dan intelegensia bisnis.
Data mining diperlukan saat data yang tersedia terlalu banyak (misalnya data yang diperoleh dari sistem basis data perusahaan, e-commerce, data saham, dan data bioinformatika), tapi tidak tahu pola apa yang bisa didapatkan.

Pada dasarnya data mining dibedakan menjadi dua fungsionalitas, yaitu deskripsi dan prediksi. Berikut ini beberapa fungsionalitas data mining yang sering digunakan:
        Karakterisasi dan Diskriminasi : yaitu menggeneralisasi, merangkum, dan mengkontraskan karakteristik data.
       Penggalian pola berulang : yaitu pencarian pola asosiasi (association rule) atau pola intra-transaksi, atau pola pembelian yang terjadi dalam satu kali transaksi.
       Klasifikasi : yaitu membangun suatu model yang bisa mengklasifikasikan suatu objek berdasar atribut-atributnya. Kelas target sudah tersedia dalam data sebelumnya, sehingga fokusnya adalah bagaimana mempelajari data yang ada agar klasifikator bisa mengklasifikasikan sendiri.
       Prediksi : yaitu memprediksi nilai yang tidak diketahui atau nilai yang hilang, menggunakan model dari klasifikasi.
       Penggugusan/Cluster analysis : yaitu mengelompokkan sekumpulan objek data berdasarkan kemiripannya. Kelas target tidak tersedia dalam data sebelumnya, sehingga fokusnya adalah memaksimalkan kemiripan intrakelas dan meminimalkan kemiripan antarkelas.
       Analisis outlier : yaitu proses pengenalan data yang tidak sesuai dengan perilaku umum dari data lainnya. Contoh: mengenali noise dan pengecualian dalam data.
       Analisis trend dan evolusi : meliputi analisis regresi, penggalian pola sekuensial, analisis periodisitas, dan analisis berbasis kemiripan.

Data mining adalah salah satu bagian dari proses pencarian pola. Berikut ini urutan proses pencarian pola:
Pembersihan Data : yaitu menghapus data pengganggu (noise) dan mengisi data yang hilang.
Integrasi Data : yaitu menggabungkan berbagai sumber data.
Pemilihan Data : yaitu memilih data yang relevan.
Transformasi Data : yaitu mentransformasi data ke dalam format untuk diproses dalam penggalian data.
Penggalian Data: yaitu menerapkan metode cerdas untuk ekstraksi pola.
Evaluasi pola : yaitu mengenali pola-pola yang menarik saja.
Penyajian pola : yaitu memvisualisasi pola ke pengguna.

Mitos Data Mining :
1. DM menyediakan prediksi sekejap, kenyataannya merupakan proses yang panjang dan  
   proaktif
2. DM belum jelas untuk aplikasi bisnis apa, kenyataannya hampir semua aplikasi bisnis  
   dapat menggunakan DM
3. DM memerlukan database terpisah, kenyataannya oleh perkembangan teknologi
   informasi DM dapat tidak memiliki database terpisah
4. Hanya seorang ilmuwan yang dapat menerapkan DM, kenyataannya aplikasi DM sekarang
   memungkinkan seorang manager menengah menggunakan DM
5. DM hanya untuk perusahaan yang mempunyai data yang sangat besar, kenyataanya jika 
   data secara akurat dapat mencerminkan bisnis makan perusahaan kecilpun dapat
   menggunakan DM




 

12/15/2011

Cara Mengetahui Software yang baik

Keunggulan manfaat strategis TI bagi perusahaan
    -          Untuk mencapai visi dan misi
    -          Untuk keunggulan bersaing
    -          Meningkatkan operasi bisnis
    -          Mempromosikan innovasi bisnis
    -          Mempertahankan pelanggan dan pemasok
    -          Membuat tembok penghalang bagi pendatang baru
    -          Membangun suatu platform TI yang strategis

Bagaimana anda mengetahui software yang baik dari sisi kualitas ?
-  Adanya garansi software
-  Kebenaran, sejauh mana sistem bebas dari kesalahan spesifikasi, desain maupun
   implementasi
-  Kegunaan, dimana pengguna dapat dengan mudah menggunakan software
-  Efisiensi, mengurangi penggunaan sumber daya sistem, termasuk memori dan waktu
   eksekusi
-  Keandalan, kemampuan suatu sistem untuk melakukan fungsi yang diperlukan dan
   bertahan lama
-  Integritas, sejauh mana sistem dapat mencegah akses yang tidak sah dan layak untuk
   program dan data
-  Adaptasi, dimana sistem dapat digunakan tanpa ada modifikasi
-  Akurasi, dimana sebuah sistem bebas dari kesalahan terutama berkenaan dengan
   jumlah output
-  Ketahanan, sejauh mana ketahanan sistem tersebut dapat berfunsi terus menerus
-  Maintenance, kemudahan yang didapat dalam merawat software



Green Computing dan Cloud Computing


-  GREEN COMPUTING (Komputer Hijau)
Komputasi hijau atau hijau TI, mengacu pada komputasi ramah lingkungan atau IT. Dalam artikel TI Hijau Memanfaatkan: Prinsip dan Praktek, San Murugesan mendefinisikan bidang komputasi hijau sebagai "studi dan praktek perancangan, manufaktur, menggunakan, dan membuang komputer, server, dan subsistem-seperti diasosiasikan sebagai monitor, printer, penyimpanan perangkat, dan jaringan dan komunikasi sistem-efisien dan efektif dengan dampak minimal atau tidak ada pada lingkungan ".Tujuan dari komputasi hijau mirip dengan kimia hijau , mengurangi penggunaan bahan berbahaya, memaksimalkan efisiensi energi selama hidup produk, dan mempromosikan daur ulang atau biodegradabilitas produk mati dan limbah pabrik. Penelitian berlanjut ke daerah-daerah kunci seperti membuat penggunaan komputer sebagai energi-efisien mungkin, dan merancang algoritma dan sistem untuk efisiensi teknologi yang berhubungan dengan komputer.

-  CLOUD COMPUTING
Cloud computing adalah pengiriman komputasi sebagai layanan bukan produk, dimana sumber daya bersama, perangkat lunak, dan informasi disediakan untuk komputer dan perangkat lain sebagai utilitas (seperti jaringan listrik) melalui jaringan (biasanya internet). Cloud computing menyediakan komputasi, perangkat lunak, akses data, dan jasa penyimpanan yang tidak memerlukan pengguna akhir pengetahuan tentang lokasi fisik dan konfigurasi dari sistem yang memberikan layanan. Parallels untuk konsep ini dapat ditarik dengan jaringan listrik, dimana pengguna akhir mengkonsumsi daya tanpa perlu memahami komponen perangkat atau infrastruktur yang diperlukan untuk menyediakan layanan.

Technology Web


Technology Web 1.0
atau web mengacu pada tahap pertama dari World Wide Web menghubungkan halaman Web dengan hyperlink. Secara umum, Web 1.0 dikembangkan untuk pengaksesan informasi dan memiliki sifat yang sedikit interaktif.

Technology Web 2.0
adalah sebuah istilah yang dicetuskan pertama kali oleh O'Reilly Media pada tahun 2003, dan dipopulerkan pada konferensi web 2.0 pertama di tahun 2004,[1] merujuk pada generasiyang dirasakan sebagai generasi kedua layanan berbasis web seperti situs jaringan sosial, wiki, perangkat komunikasi, dan folksonomi yang menekankan pada kolaborasi online dan berbagi antar pengguna. O'Reilly Media, dengan kolaborasinya bersama Media Live International, menggunakan istilah ini sebagai judul untuk sejumlah seri konferensi, dan sejak 2004 beberapa pengembang dan pemasar telah mengadopsi ungkapan ini.
Walaupun kelihatannya istilah ini menunjukkan versi baru daripada web, istilah ini tidak mengacu kepada pembaruan kepada spesifikasi teknis World Wide Web, tetapi lebih kepada bagaimana cara si-pengembang sistem di dalam menggunakan platform web. Mengacu pada Tim Oreilly, istilah Web 2.0 didefinisikan sebagai berikut:
"Web 2.0 adalah sebuah revolusi bisnis di dalam industri komputer yang terjadi akibat pergerakan ke internet sebagai platform, dan suatu usaha untuk mengerti aturan-aturan agar sukses di platform tersebut. ”

Technology Web 3.0
adalah generasi ketiga dari layanan internet berbasis web. Konsep Web 3.0 pertama kali diperkenalkan pada tahun 2001, saat Tim Bersners Lee, penemu World Wide Web, menulis sebuah artikel ilmiah yang menggambarkan Web 3.0 sebagai sebuah sarana bagi mesin untuk membaca halaman-halaman Web. Hal ini berarti bahwa mesin akan memiliki kemampuan membaca Web sama seperti yang manusia dapat lakukan sekarang ini.
Web 3.0 berhubungan dengan konsep Web Semantik, yang memungkinkan isi web dinikmati tidak hanya dalam bahasa asli pengguna, tapi juga dalam bentuk format yang bisa diakses oleh agen-agen software. Beberapa ahli bahkan menamai Web 3.0 sebagai Web Semantik itu sendiri.
Keunikan dari Web 3.0 adalah konsep dimana manusia dapat berkomunikasi dengan mesin pencari. Kita bisa meminta Web untuk mencari suatu data spesifik tanpa bersusah-susah mencari satu per satu dalam situs-situs Web. Web 3.0 juga mampu menyediakan keterangan-keterangan yang relevan tentang informasi yang ingin kita cari, bahkan tanpa kita minta.
Web 3.0 terdiri dari:
  • Web semantik
  • Format mikro
  • Pencarian dalam bahasa pengguna
  • Penyimpanan data dalam jumlah besar
  • Pembelajaran lewat mesin
  • Agen rekomendasi, yang merujuk pada kecerdasan buatan Web
Web 3.0 menawarkan metode yang efisien dalam membantu komputer mengorganisasi dan menarik kesimpulan dari data online. Web 3.0 juga memungkinkan fitur Web menjadi sebuah sarana penyimpanan data dengan kapasitas yang luar biasa besar.
Walaupun masih belum sepenuhnya direalisasikan, Web 3.0 telah memiliki beberapa standar operasional untuk bisa menjalankan fungsinya dalam menampung metadata, misalnya Resource Description Framework (RDF) dan the Web Ontology Language (OWL). Konsep Web Semantik metadata juga telah dijalankan pada Yahoo’s Food Site, Spivack’s Radar Networks, dan sebuah development platform, Jena, di Hewlett-Packard.

Technology Web 4.0
adalah ketika teknologi ini datang bersama untuk membentuk apa yang saya sebut "Belajar Web". Ini bergerak lebih ke bidang Artificial Intelligence.

Jenis-jenis Web


1. Web Portal
Kadangkala disebut dengan portal atau portal internet. Di dalam dunia internet istilah ini dimaksudkan untuk website yang menyediakan beraneka ragam informasi untuk para pengunjungnya. salah satu portal dari Indonesia adalah DetikCom (http://www.detik.com yang disebut dengan portal berita dan dikelola oleh Agrakom

2. Web Pribadi
World Wide Web halaman yang dibuat oleh individe untuk mengandung konten yang bersifat pribadi atas nama majikan atau lembaga. Halaman web probadi yang sering digunakan semata-mata untuk informatif atau hiburan.
Isi dari halaman web pribadi bervariasi, mulai dari informasi biografis, resume, dan blog posting. Banyak halaman pribadi yang mencakup informasi tentang hobi penulis, minat dan informasi yang menarik hanya untuk teman-teman dan keluarga penulis

3. Web Edukasi
Web yang berisi dan mencakup segala informasi yang berkaitan dengan pendidikan.

4. Web Hiburan
Web yang di dalamnya terdapat informasi yang bertujuan sebagai hiburan untuk user.

5. Web Bisnis
Web yang di dalamnya berisikan konten mengenai informasi seputar masalah bisnis

6. Web Information
Web yang dibuat dengan tujuan memberikan informasi-informasi kepada pengguna situs online (user) yang berisikan informasi-informasi.

7. Web Commercial
(Company Profile / Online Shop, biasa menggunakan .com, .co.id, dsb), yaitu situs yang dipakai untuk menunjukkan produk dan jasa suatu perusahaan, atau juga dapat melakukan transaksi penjualan online (dengan sistem Shopping Cart System)

8. Web Aggregator Konten
web individu atau organisasi yang mengumpulkan konten Web (dan / atau kadang-kadang aplikasi) dari sumber online yang berbeda untuk digunakan kembali atau dijual kembali. Ada dua jenis agregator konten: (1) mereka yang hanya mengumpulkan bahan dari berbagai sumber untuk situs Web mereka, dan (2) orang-orang yang mengumpulkan dan mendistribusikan konten untuk memenuhi kebutuhan pelanggan mereka. Proses yang terakhir ini disebut sindikasi .

9. Web Advokasi
web mengenai aksi strategis yang ditujukan untuk menciptakan kebijakan public yang bermanfaat bagi masyarakat atau mencegah munculnya kebijakan yang diperkirakan merugikan masyarakat.” (Socorro Reyes, Local Legislative Advocacy Manual, Philippines: The Center for Legislative Development, 1997).

10. Web Wiki
Web yang berisikan informasi dimana para penggunanya bisa ikut mengedit isinya