Skip to content

AWK #
Find similar titles

Structured data

About
Programming language
Date Published
URL

AWK is an interpreted programming language designed for text processing and typically used as a data extraction and reporting tool. (http://en.wikipedia.org/wiki/AWK)

Shell 명령으로 자주 사용됨

쉬운 예제

$ cat students
John,P Physics 20
Rick,L Mechanical 21
Jack,T electrical 23

$ awk '$3>22 {print $1}' students
Jack,T

또 다른 예제

awk "{print FILENAME}" test.txt 
= test.txt 파일의 레코드 개수만큼 파일이름을 출력한다.

awk "{print NR}" test.txt
= test.txt 파일의 레코드 번호를 출력한다.

awk 'BEGIN {FS="\t"} {print $1 ,  $2}' test.txt
= test.txt 파일의 필드 구분자를 "\t" 으로 지정하고, 1번째와 2번째 필드를 프린트 한다.

awk 'BEGIN {FS="\t"; OFS ="-"} {print $1 ,  $2} END {print "총 레코드의 수 : " NR}' test.txt
= test.txt 파일의 필드 구분자를 "\t" 로 지정하고, 1번째와 2번째 필드를 프린트 하되, 필드 구분자를 "-"
로 바꾸어 출력하고, 모든 레코드가 끝난 뒤, 총 레코드의 수를 출력한다.

BED 유사 형식을 BED로 만들기

$ head affygw6.hg18.gcmodel
Name    Chr     Position        GC
CN_939648       22      33091470.5      41.4366643345771
CN_979832       3       25273689.5      38.5128070584577
SNP_A-8401955   6       101433515       36.3118975435323
SNP_A-8337062   3       31935870        41.7804532027363
SNP_A-1966191   2       184761027       34.7928327114428
SNP_A-8431138   15      60931289        43.6610890858209
CN_1111605      5       164805725.5     36.0293260261194
CN_836139       2       112447333.5     42.4281910758707
SNP_A-4304307   12      48311193        47.2295747823383
$
$ awk 'BEGIN {FS="\t"; OFS="\t"} {print $2, $3, $3 $1, $4}' affygw6.hg18.gcmodel  | sort -k 1 -n > snp6.gc.bed
$
$ head snp6.gc.bed
Chr     Position        Position        Name    GC
X       100001818.5     100001818.5     CN_952177       41.3781677549751
X       100002341.5     100002341.5     CN_952178       41.3781677549751
X       100005379.5     100005379.5     CN_952179       41.3948810634328
X       100005431       100005431       SNP_A-2311823   41.3948810634328
X       100007151       100007151       SNP_A-8361134   41.3948810634328
X       100009055.5     100009055.5     CN_952180       41.3948810634328
X       100009686.5     100009686.5     CN_417009       41.4014886504975
X       10000997.5      10000997.5      CN_945342       43.9570701181592
X       100012344.5     100012344.5     CN_952181       41.4014886504975

Incoming Links #

Related Articles #

Suggested Pages #

web biohackers.net
0.0.1_20140628_0