Apri for Human Being

this is not my blog, this is my log ….

Command and Conquer: Menggabungkan file dan membuang baris yang dobel

leave a comment »

Sesuai tulisan saya sebelumnya yang nanggung😛, kira2 paragraf terakhirnya begini:

Nah sekarang ada kasus nih, ini berdasarkan pengalaman salah seorang teman. Dia punya 3 handphone, pastinya bukan handphone murah, wong bisa sync sama outlook di jendela koq. Nah masalahnya 3 handphone ini ada beberapa kontak yang sama antara handphone satu dan yang lainnya, tetapi banyak juga kontak yang ada di satu handphone tapi nggak ada di handphone lain. Nah dia pengen semua handphone itu kontaknya sama semua, soalnya dia mau jual salah satu atau salah dua dari handphone itu. Klo gabungin di outlook jelas gak mungkin bisa sinkron, pasti ada yang keapus entah kontak di outlook atau kontak di handphone yang di sync. Trus solusinya gimana?

Sekarang saya kasih solusinya😀

Pertama2 sync semua handphone tersebut dengan outlook, ya, pake outlook, wong ga bisa di sync ke linux *kuciwa* caranya ya silahkan belajar ndiri, soale saya ga tau, pokoke intinya sync ke outlook dengan mereplace kontak yang ada di outlook dengan kontak yang ada di hape. Setelah itu ekspor ke bentuk .csv (comma separated value). Setelah diekspor, delete semua kontak di outlook, lalu lakukan dengan handphone kedua diulangi dengan sync ke outlook begitu seterusnya sampe nggak ada handphone yang di sync …. jadi ntar Anda bakalan punya 3 file .csv yaitu misal nama filenya:

  • kontak_hp1.csv
  • kontak_hp2.csv
  • kontak_hp3.csv

Lah terus selanjutnya gimana? ya seperti yang saya tulis sebelumnya, pake perintah $ cat, 3 file itu digabung, caranya:

$ cat kontak_hp1.csv kontak_hp2.csv kontak_hp3.csv > kontak.csv

Kalau udah, buat mastiin ada yang dobel pake perintah $ sort, misal:

$ sort kontak.csv

ntar bakalan disort ascending, klo banyak ya ntar nongol banyak😛, nah sekarang gimana buangnya? perintah sort bisa digabungkan dengan perintah $ uniq. Perintah uniq ini ada beberapa opsi, antara lain:

  • -c untuk menampilkan jumlah duplikat dan barisnya
  • -u untuk menampilkan baris yang unik (tidak termasuk duplikat)
  • -d untuk menampilkan baris yang duplikat (tidak termasuk yang unik)

Yang lain silahkan dikasi opsi –help atau man uniq yah😀 sekarang kembali ke topik, berikutnya yaitu kita akan melakukan sorting atau pengurutan dan mengelompokkan yang baris yang dobel/duplikat, caranya gimana?

$ sort kontak.csv | uniq -c > kontak_baru.csv

sedikit penjelasan, perintah tersebut memerintahkan mengurutkan baris di dalam file kontak.csv lalu dihitung jumlah barisnya yang sama dan dijadikan file baru bernama kontak_baru.csv. Nah setelah itu ada pekerjaan manual yg harus dilakukan xixixi, coba buka file kontak_baru.csv. di depan baris2 tersebut terdapat angka2 jumlah row tersebut pada file sebelumnya (kontak.csv) jadi tugas kita sekarang adalah menghapus2nya soale ntar klo diimpor lagi error dink hehehe.

Catatan: perbedaan format baris2 nama, alamat, nomor telepon dan lain2 pada tiap2 handphone yang membuat beda di kolom di outlook akan menampilkan output csv yang beda pula😀 klo gini meski namanya sama persis tapi pasti rownya sama perintah uniq bakalan dianggep beda hehehe, ya setidaknya perintah uniq sedikit membantu daripada bahasa jawanya metani kontak siji2 xixixi …

Yah, itu yang bisa saya share sekarang, C&C ntar bersambung lagi yah😀

Written by apri

8 Juni 2010 pada 11:26

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s

%d blogger menyukai ini: