'분류 전체보기' 카테고리의 글 목록 (78 Page)

내용 출처 : 토끼군의 알 수 없는 세상

나는 zdnet을 잘 들여다 보진 않지만 아주 어쩌다가 쓸 만한 기사가 나오기 때문에 좋든 싫든 한 달에 너댓 번 쯤은 zdnet을 들어 가게 된다. 이번 기사도 (날짜는 상당히 지났건만;;) 그런 것 중 하나다.

zdnet 홈페이지에서 기사를 보시라. 아래는 기사 내용 중 실제로 구글을 사용하면서 편리할 것들을 (내 맘대로) 정리해 놓은 것이다. (본인이 쓸 목적도 있고, 혹시 필요할 사람이 있을까봐...)

구글의 컴퓨팅 규모

구글의 자산 가격(약 250 million $)을 기준으로 구글의 컴퓨팅 파워를 계산할 수 있다. 여기에서 나온 정보는 물론 실제 정보가 아니며 대략적인 범위만을 기재한 것이다:

랙: 539 - 899개 / 시스템: 47,432 - 79,112개 / CPU: 94,864 - 158,224개

프로세스 파워: 189,728 - 316,448GHz / 램: 94,864 - 158,224GB / 하드디스크: 3,705 - 6,180TB

전체 컴퓨팅 성능: 189 - 316 테라플롭스

참고로 top500.org의 2004년 6월 집계에 따르면 현재 최고 성능의 슈퍼 컴퓨터가 40 테라플롭스의 성능을 가지고 있다. (우리나라는 45위의 KAIST가 최고로, 5 테라플롭스의 성능을 가지고 있다. 비교되지 않는가;;;)

구글에서 좋은 검색 결과를 찾기 위한 방법

- 구글이 보여 주는 검색 결과는 항상 1000건 이내에서 잘라져서 나오기 때문에, 최대한 검색 집합을 줄이는 것이 중요하다.

- 단어는 기본적으로 and 연산으로 묶여진다. not 연산은 단어 앞에 -를 붙이는 것으로 구현된다.

- 중요한 단어를 최대한 앞에 놓는다. 구글의 검색 결과 출력은 단어 순서에 영향을 받는다.

- 일반적인 단어는 최대한 지운다. 책 이름 같은 데 포함될 경우 "..."로 확실하게 묶어 준다. 만약 꼭 필요하다면 단어 앞에 +를 붙여 주면 검색한다.

- 동일한 단어를 여러 개 나열할 경우 그 만큼 단어가 더 많이 들어 있는 페이지만을 검색하기 때문에 검색 집합을 좀 더 줄일 수 있다.

- 구글에서는 와일드카드를 사용할 수 있다. 단, 무조건 단어 단위기 때문에 "나의 살던 * * 산골" 식으로 단어들 대신으로만 쓰일 수 있다. (와일드 카드는 10단어 제약에 포함되지 않는다.)

- 메타 구문을 잘 활용하라. 아래에 그 리스트를 정리해 놓았다.

구글의 특수 구문

모든 메타구문은 blahblah:어쩌구 식으로 사용된다. 해당 메타구문에 not 연산을 적용할 경우 단어와 마찬가지로 -를 앞에 붙이면 된다. (-blahblah:어쩌구)

- allinanchor: 링크 텍스트(즉, a 태그로 묶인 텍스트)에서 검색

- allintext: 본문 안에서 검색

- allintitle: 제목 안에서 검색 (중요한 단어를 allintitle로 넣는 것이 좋다.)

- allinurl: URL 안에서 검색

- cache: 구글이 캐시하고 있는 페이지를 검색

- daterange: 페이지가 색인된 날짜를 지정한다. "<시작>-<끝>" 형태로 쓰며 반드시 Julian Date 형식으로 입력해야 한다. (뒤에서 설명)

- define: 영어 단어 정의를 검색한다. 한국어는 특수 구문이 없고 대신 "단어"나 "용어"를 앞뒤에 추가하면 된다.

- filetype: 파일 형식으로 검색한다. pdf, ps, xls, doc, rtf, ppt를 사용할 수 있다.

- info: 페이지의 정보를 보여 준다.

- link: 특정 URL로 링크를 건 페이지를 검색한다.

- related: 특정 URL과 비스무레한 페이지를 검색한다.

- site: 특정 사이트를 대상으로(해당 도메인 아래에 있는) 페이지를 검색한다.

Julian Date는 기원전 4713년 1월 1일 이후 지난 날 수(GMT 기준)이다. 혹시나 UNIX Timestamp에 대해 알고 있다면, (timestamp - 946727935.816) / 86400 + 2451545라는 식으로 Julian Date를 얻을 수 있다. (이 글을 쓰는 시점에서 Julian date는 2453245.09이다.)

혹시나 HanIRC를 쓰는 분이 있다면 #perky 혹은 #tokigun 채널에서 종종 떠 다니는 토끼냥(본인이 만든 irc 봇-_-)에게 &-timestamp jd 2004 8 7 0 0 0과 같은 명령을 주면 Julian Date를 변환해서 보여 줄 것이다. 물론 토끼냥은 그렇게 자주 보이는 건 아니다 ;)

구글의 또 다른 기능

- 특수 구문 말고 문장의 앞뒤에 특정한 단어를 입력하면 특정한 종류의 검색을 자동으로 해 주는 기능이 있다. "단어"나 "용어"는 단어/용어 검색, "날씨"는 날씨, "주가"는 주가 및 기업 정보(그냥 종목코드만 써도 된다), "우편번호"는 우편번호를 알려 준다.

- 운 좋은 예감 버튼도 종종 괜찮을 때가 있다. :) 불여우에서 도메인이 아닌 엉뚱한 단어가 주소창에 들어 왔을 경우 기본적으로 구글의 운 좋은 예감으로 연결된다. (넷피아가 없어도 :)

- 계산기 기능도 있는데, 여기에 대해서는 google guide에 있는 페이지를 읽는 게 도움이 될 것이다. 간단한 사칙 연산부터, 단위 변환, 복소수 연산-_- 등이 가능하다.

구글 애플리케이션과 사이트

- 구글 툴바를 사용하면 브라우저(MSIE)에서 바로 구글 검색을 할 수 있다. 모질라/불여우에서는 GoogleBar라는 확장 기능을 대신 사용할 수 있다.

- 구글 데스크바를 사용하면 데스크탑에서 바로 구글 검색을 할 수 있다.

- google guide: 구글을 활용하는 많은 방법을 소개하고 있다.

- googlism: 구글에서 검색된 페이지를 바탕으로 구글이 특정 단어에 대해서 어떻게 정의내리고 있는 지(;;) 알아 볼 수 있다. 예를 들어서 빌 게이츠 같이...

- googlewhacking: 사전에 존재하는 특정한 두 단어의 조합으로 단 하나의 페이지 검색 결과만을 얻어 내는 놀이.

- Toogle: 구글 이미지 검색의 첫 결과를 ASCII 문자들로 변환해 준다. (저번에 소개한 적이 있음)

이거 말고 또 하나 더 있는데 이름을 까먹어서 찾을 수 조차 없었다... ;;; 마지막으로 Google Labs에서는 구글이 준비하고 있는 여러 가지 다른 서비스들을 구경해 볼 수 있다.

'Web' 카테고리의 다른 글

구글 애드센스 용어 (0)	2006.03.18
Picasa (0)	2006.03.17
구글이 사이트 수집못하게 막기 (1)	2006.02.17
피드한것이 깨질때. (1)	2006.02.17
구글 애드센스를 달아보자. (0)	2006.02.17

구글에서 퍼왔습니다.

사이트 일부, 또는 전체를 구글이 수집 못하게 하시려면 다음의 내용을 지닌 robots.txt파일을 서버 루트(root) 디렉토리에 저장하세요:

User-Agent: *

Disallow: /

이것은 사이트를 검색기에서 제외하는 표준입니다. 다음의 문서를 참조하시면 이 표준에 대한 더 자세한 정보가 있습니다 (영문 문서입니다): http://www.robotstxt.org/wc/norobots.html

참조: 만약 긴급하게 하는 요청이고, 구글의 자동 검색 로봇을 못 기다리시면 구글의 자동 삭제 시스템을 사용하세요. 먼저 해당하는 페이지의 관리자가 사이트에 robots.txt 파일을 저장해야 결과에서 자동적으로 링크를 지우는 이 기능이 올바르게 작동합니다.

웹 서버의 루트(root) 디렉토리에 robots.txt 파일이 저장돼 있으면 페이지들은 계속 구글의 검색 결과에서 제외됩니다. 또한, 루트 디렉토리에 사용자 권위가 없으시더라도 robots.txt 파일을 해당하는 폴더에 저장하면 됩니다. 자동 제외 시스템을 같이 사용하시면 임시적인 180일 동안 구글 검색에서 제외됩니다. (하지만, 루트 폴더가 아닌, 다른 곳에 저장한 상태이면 180일마다 또다시 자동 제외 시스템을 사용하셔야 계속 제외됩니다.)

모든 검색 로봇을 막으시려면 다음의 메타 테그(meta tag)를 HTML페이지에 포함하세요:

<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

구글 로봇을 제외한 다른 검색 로봇을 허용하시려면 다음의 메타 태그를 사용하세요:

<META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW">

이 표준 메타 태그에 대한 더 많은 정보가 필요하시면 다음 페이지를 방문하세요: http://www.robotstxt.org/wc/exclusion.html#meta.

참조: 만약 긴급하게 하는 요청이고, 구글의 자동 검색 로봇을 못 기다리시면 구글의 자동 제외 시스템을 사용하세요. 먼저 해당하는 페이지의 관리자가 페이지의 HTML 안에 올바른 메타 태그를 입력해야 이 시스템의 기능이 작동합니다.

구글 검색 결과에는 URL 내용을 보여드립니다. 나타나는 검색어들을 bold체로 보기 쉽게 하고, 문맥으로 내용을 파악하실 수 있게 해드립니다. 이렇게 내용을 미리 볼 수 있게 하여 사용자가 원하는 결과를 더욱 정확하게 찾을 수 있게 해 드립니다.

구글이 자신의 페이지를 보지 못하도록 하고 싶다면 다음 태그를 사용하세요:

<META NAME="GOOGLEBOT" CONTENT="NOSNIPPET">

참고: 삭제할 때에는 저장되어 있던 페이지도 삭제됩니다.

참조: 만약 긴급하게 하는 요청이고, 구글의 자동 검색 로봇을 못 기다리시면 구글의 자동 제외 시스템을 사용하세요. 먼저 해당하는 페이지의 관리자가 페이지의 HTML 안에 올바른 메타 태그를 입력해야 이 시스템의 기능이 작동합니다.

구글은 수집한 모든 문서들을 저장해둡니다. 구글은 저장된 문서를 사용자들을 위해 제공하고, 무슨 이유로 사이트에 접속이 불가능하면 구글의 저장된 페이지를 사용하여 구글이 수집했던 당시의 모습 그대로 볼 수 있습니다. 저장된 페이지는 위 부분에 원본이 아닌 복사된 내용임을 설명하는 메시지가 있습니다.

만약 로봇이 귀하의 사이트에서 내용을 수집 못하게 하고 싶다면, NOARCHIVE 메타 태그를 사용하세요. 이 태그는 문서의 부분에 다음과 같이 배치 하세요.

<META NAME="ROBOTS" CONTENT="NOARCHIVE">

만일 목록을 붙이는 다른 로봇들이 사용자의 페이지에 있는 내용을 수집하는 것을 허락하고, 단지 구글의 로봇들이 페이지를 저장하는 것을 막고 싶으시다면, 다음 태그를 사용하세요.:

<META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">

참조: 이 태그는 페이지에서 단지 저장된 페이지만 삭제합니다. 구글은 계속해서 페이지를 색인하고 그 일부 내용을 보여줍니다.

참조: 만약 긴급하게 하는 요청이고, 구글의 자동 검색 로봇을 못 기다리시면 구글의 자동 제외 시스템을 사용하세요. 먼저 해당하는 페이지의 관리자가 페이지의 HTML 안에 올바른 메타 태그를 입력해야 이 시스템의 기능이 작동합니다.

구글은 정기적으로 새롭게 웹 페이지를 수집합니다. 구글은 웹을 색인하며 새로운 페이지를 찾고, 삭제 된 링크는폐기하고, 링크를 자동적으로 업데이트 합니다. 접속과 연결이 안 되는 링크는 색인에서 없어집니다.

참조: 만약 긴급하게 하는 요청이고, 구글이 다음번에 사용자의 사이트를 색인 할 때까지 기다릴 수 없다면 저희의 자동 URL 삭제 시스템을 사용하세요. 저희는 웹상에 페이지가 더이상 존재하지 않을 때만 사용자의 삭제 요청을 받아들일 수 있습니다.

만약 사용자가 구글의 이미지 검색에서 결과 내용을 삭제하셔야 한다면, 그 사이트의 웹 마스터의 참여가 있어야 합니다. 페이지의 웹 마스터에게 robots.txt 파일을 서버의 root에 추가하도록 해주세요. (만약 그것을 서버 루트(root)에 넣을 권리가 없다면 그것을 해당하는 디렉토리 부분에 넣을 수 있습니다.)

예시: 만일 사용자의 사이트가 www.yoursite.com/images/dogs.jpg 이고 구글이 그 사이트에서 수집한 dogs.jpg 이미지를 포함하지 않기를 바라신다면,

사용자는 www.yoursite.com/robots.txt 라고 불리는 파일을 만들어야 합니다.

그리고 이 파일 안에는 다음 텍스트 내용이 있어야 합니다.

User-Agent: Googlebot-Image

Disallow: /images/dogs.jpg

저희의 목록에서 사용자의 사이트에 있는 모든 이미지를 삭제하려면 사용자의 서버 root에 다음 robots.txt 파일이 있어야 합니다.

User-Agent: Googlebot-Image

Disallow: /

웹 마스터가 이 파일을 추가한 후에는googlebot@google.com로 그 사실과 그 파일의 위치에 대한 메모를 보내주세요. 저희는 48시간 내에 그 이미지를 삭제해 드릴 것입니다.

'Web' 카테고리의 다른 글

Picasa (0)	2006.03.17
zdnet의 구글 기사 (0)	2006.02.17
피드한것이 깨질때. (1)	2006.02.17
구글 애드센스를 달아보자. (0)	2006.02.17
각종 메일 아이콘 만들어 주는 사이트 (0)	2006.02.16

UTF-8 인코딩(기본값)은 [ {0}.xml?enc=utf-8 ],

EUC-KR 인코딩은 [ {0}.xml?enc=euc-kr ]

올블로그를 피드하다가 깨지길래 살펴보니 위처럼 하니 정상적으로 나오더군요

그니까 http://homepage.com/rss.xml?enc=utf-8

http://homepage.com/rss.xml?enc=euc-kr

이 정도로..

'Web' 카테고리의 다른 글

Picasa (0)	2006.03.17
zdnet의 구글 기사 (0)	2006.02.17
구글이 사이트 수집못하게 막기 (1)	2006.02.17
구글 애드센스를 달아보자. (0)	2006.02.17
각종 메일 아이콘 만들어 주는 사이트 (0)	2006.02.16

먼저 여기를 클릭하여 구글 애드센스로 갑니다.

가볍게 웹사이트 소유자 구글애드센스를 눌러줍시다.

계정이 없으신 분은 가입을 하셔야 합니다. 언어를 한국어로 설정하시고 하세요.

가입은 어느 분도 하실수 있는 것이기 때문에 생략하겠습니다.

광고를 달려면 콘텐츠를 위한 애드센스를 클릭합니다.

검색바를 달려면 검색을 위한 애드센스를 클릭하시면 되구요.

광고를 달아보겠습니다.

흠 전 문자 및 이미지 광고를 선택하겠습니다.

각자 홈페이지 분위기에 알맞게 설정하시면 됩니다.

여기는 광고 크기를 설정하는 곳입니다.

단위는 픽셀입니다.

여기서는 광고 색상을 지정합니다.

컬러 팔레트 관리에서 자신의 색상을 지정하실수 있습니다.

여긴 별 필요 없는 사항입니다. 넘어갑시다.

채널은 광고할 분류라고 생각하시면 됩니다.

자신의 홈페이지 주제에 맞게 설정하시면 되겠습니다.

프레임이 있는 페이지에 광고가 실릴경우 체크해줍니다.

자..코드가 나왔네요...

이코드를 원하는 부분에 붙여넣으면 됩니다.

네......됬습니다..

방문객이 광고를 클릭하다보면 돈이 쌓이죠.. 달러로

그게 100달러가 모이면 집으로 수표가 날라옵니다..

화이팅!

'Web' 카테고리의 다른 글

Picasa (0)	2006.03.17
zdnet의 구글 기사 (0)	2006.02.17
구글이 사이트 수집못하게 막기 (1)	2006.02.17
피드한것이 깨질때. (1)	2006.02.17
각종 메일 아이콘 만들어 주는 사이트 (0)	2006.02.16

여기를 클릭하셔서 들어가봅시다.

무단 수집을 막기위한 방법의 하나이죠..

뭐....뽀대도 나보이고..

'Web' 카테고리의 다른 글

Picasa (0)	2006.03.17
zdnet의 구글 기사 (0)	2006.02.17
구글이 사이트 수집못하게 막기 (1)	2006.02.17
피드한것이 깨질때. (1)	2006.02.17
구글 애드센스를 달아보자. (0)	2006.02.17

Base64는 메일을 주고 받을때 쓰이는 인코팅 방식입니다.

프로그래밍은 루나씨가 해주셨습니다.

invalid-file

사용방법은

먼저 C땡에 압축을 풉시다.

시작-실행 cmd

그럼 cd\를 입력하여 루트 디렉토리로 갑니다.

거기서 base64를 입력합니다.

기본 명령어를 보실수 있습니다.

인코딩은 base64 -e 인코딩할 문자 ex)길동이바보

디코딩은 base64 -d 디코딩할 암호화된 문자 ex)sea1v8DMudm6uA==

참고로 인코딩은 암호화 디코딩은 복호화입니다.

'OS' 카테고리의 다른 글

Mbps와 Mb/s 의 차이점 (2)	2006.05.04
XP 에서 파일 확장자 표시하기 (0)	2006.05.01
MS, 버추얼 서버 신버전 출시「2007년으로 연기」 (0)	2006.03.30
잘나가는 비스타, 성능 못 따라가는 내 PC (1)	2006.03.18
장비 없이 피씨에서 나는 소리를 다시 마이크로 입력해보기. (2)	2006.02.14

Lunikism

전체보기

zdnet의 구글 기사

'Web' 카테고리의 다른 글

구글이 사이트 수집못하게 막기

'Web' 카테고리의 다른 글

피드한것이 깨질때.

'Web' 카테고리의 다른 글

구글 애드센스를 달아보자.

'Web' 카테고리의 다른 글

각종 메일 아이콘 만들어 주는 사이트

'Web' 카테고리의 다른 글

Base64-암호화&복호화

'OS' 카테고리의 다른 글

+ Recent posts

티스토리툴바