다음 RSS넷의 피드를 임시로 막는 방법.

추가: RSS넷(+블로그라인) 피드 막기에서 아이피 자체를 차단하실 수 있습니다. 아마도 그쪽이 더 좋은 방법이겠네요. 필요하신 분은 참고하시기 바랍니다.

다음 RSS넷에 대한 여러 가지 이야기가 오갔습니다만, 역시 많은 사람들의 관심사는 다음 RSS서비스의 개념적이나, 정책적인 문제점과 해결 방안 보다는 자신의 블로그를 다음 RSS넷으로부터 통제하는 방안에 대해 쏠려 있는 모양입니다.

진산님으로부터 다음 RSS넷으로부터의 수집을 엉성하게나마 막을 수 있는 간단한 방법에 대한 질문을 받았습니다. 설치형 블로그 사용자이고, 자신이 사용하는 서버가 아파치 웹서버라면 아래와 같은 방법으로 간단히 다음 RSS넷으로부터의 글 수집을 막을 수 있습니다. 아래의 내용을 '.htaccess' 파일에 저장해서 블로그와 같은 디렉토리에 두면 됩니다. (물론 블로그가 php 기반이 아닌 경우에는 확장자를 추가하면 되겠지요.)

[CODE]SetEnvIF Referer "http://rss.daum.net" pass <FilesMatch ".\r (php|PHP)$"> Order allow,deny allow from all deny from env=pass </FilesMatch>[/CODE]
'.htacess' 파일이 이미 있다면 덮어써버리면 곤란한 문제가 생길 지도 모릅니다. 이 때에는 파일을 열어 위의 내용을 추가하거나, 수정해주세요. 완벽할 수는 없지만 다음 RSS넷으로부터의 수집을 막아줍니다. 다음 RSS넷으로부터의 글이 수집되는 것이 걱정되시는 경우에는 일단 이렇게 수정하고 다음의 정책이나 기능상의 변경을 기다렸다가 다시 허용하는 방법을 생각해볼 수 있겠네요. 물론 php스크립트를 수정해 조금 더 단단하게 만들 수 있지만 우선은 이정도로도 목적을 달성할 수 있을 겁니다.


ps. 지금에서야 드는 생각인데, 다음 RSS넷의 로봇은 robot.txt를 준수하지 않았으려나요 ;
2005/01/21 17:49 2005/01/21 17:49

트랙백

  • Tracked from micsland.com 2005/01/21 17:53x
    제목 : RSS넷(+블로그라인) 피드 막기

    들어가기 전에. 처음 방법을 알아내고 이 글을 쓰기까지 약간 고민했습니다. 방식이나 내용은 그리 문제될 것도 없는 팁이지만 이것이 자칫 다음커뮤니케이션에 불이익을 주는게 아닐까 하는 ?

  • Tracked from 진산마님의 MARS 2005/01/21 19:42x
    제목 : 설치형 블로그에서 다음 RSS넷의 피드를 막는 방법

    에 대한 질문을 밀피유님께 드렸고, 밀피유님께서 답을 주셨고 다른 방법에 대한 추천도 해주셨습니다. 조그나 태터 같은 설치형 블로그 쓰시는 분 중에 다음 RSS 넷에서 본인의 주소를 긁어가?

답글

  • 믹스 | 2005/01/21 17:52 | 답글 | 수정

    저거 작동 가능한가요? 그렇다면 대삽질했군요;
    제가 조사한 로그에는 리퍼러가 하나도 잡히지 않았었는데..흠;

  • 밀피유 | 2005/01/21 17:54 | 답글 | 수정

    제 리퍼러리스트에는 rss.daum.net으로부터의 리퍼러가 잔뜩 있던데요 ; 6시간 전을 기준으로 1024히트가 이 주소로부터 걸려있었어요.

  • 믹스 | 2005/01/21 17:56 | 답글 | 수정

    아 그건 블로그에 직접 접속한 리퍼러 아닌가요?

  • 밀피유 | 2005/01/21 18:00 | 답글 | 수정

    흠. 일단 저는 차단할 생각은 없으므로 확실하게 테스트해 보지는 않았습니다. 아무래도 확실히 확인되지 않은 사항이므로 믹스님의 말씀대로 아이피를 차단하는 쪽이 확실하다고 생각되네요.

  • 진산 | 2005/01/21 18:37 | 답글 | 수정

    답변해주셔서 감사합니다. 과연 통제가 가능한 것인지 궁금해서 테스트 해보는 중인데 뭔가 문제가 발생해서 아예 저도 못들어가고 있습니다 (...) 뭐 고객센터에 메일 보냈으니 언젠간 해결되겠죠.

  • Huck | 2005/01/22 04:17 | 답글 | 수정

    rss넷 개발자입니다..
    xml을 가져가는 것은 로봇이라기보다 웹클라이언트라고 할 수 있습니다.
    검색과는 달리 처음부터 지정한 url에 바로 접속하여 그 url에서 주는 정보만 받아오니까요..

  • 밀피유 | 2005/01/22 09:41 | 답글 | 수정

    진산님: 일단은 해결된 것 같으니 다행이네요. 다음도 생각보다 무척 빠르게 대응하고 있는 것 같아 보이니 금새 나아지지 않을까 싶어요.

    Huck님: 웹클라이언트라고 하더라도 robot.txt 정도의 규약을 준수하는건 괜찮은 타협안이 아닐까 싶어요.

  • Huck | 2005/01/22 11:33 | 답글 | 수정

    접니다.. ㅡㅡㅋ
    아.. 그리고 제가 적는 글은 어디까지나 개인적인 입장에서 질문들에 답을 달아 드리는 것이라는것은 알아주셨으면 합니다..
    (상황이 상황이다보니 조금 민감하게 되었습니다.)

    기술적인 쪽으로만 글을 쓰겠습니다..
    언제나 그렇듯 기술적인 표준에 맞게 하려는 것과 정책적인 결정이 다른 경우는 항상 있으니까요..

    robot.txt를 지키는것이야 어렵지 않은데 언제나 그렇듯이 어떤것이든 처음 만들어진 목적으로 쓰이지 않게 되면 또다른 문제가 발생하기 마련입니다.

    robot.txt는 "링크를 따라가며 웹을 순환하며 불특정한 자원을 수집해가는 프로그램"에 제한을 두기위하여 만든것입니다.

    저희가 robot.txt을 따르게되면 사용자입장에서는 검색과 xml피딩에 다른 정책을 가지고 가기가 힘듭니다. robot.txt의 의미가 기존의 의미보다 넓게 재해석 되어버리는것이죠.. robot.txt를 사용하는 입장의 의도가 프로그램의 입장에서 곡해되어 해석되어질 위험이 있는 것입니다.

    저희가 피드를 긁어 가는 서버는 이전 답글에 남겼듯이 로봇이라기보다 사용자와 xml피드 서버 사이의 프록시 서버 정도의 개념이므로 xml에 대한 접근을 막고자한다면
    웹에서 일정 url에는 일정사람이 접근하지 못하도록 하는 방법을 사용하는 것이 좀더 올바른 방법으로 보여집니다.

  • Huck | 2005/01/22 11:38 | 답글 | 수정

    수정을 하려 했는데 비밀번호를..

    위 댓글은 개인적인 의견입니다.
    실제 서비스에서는 robot.txt 를 지켜야 되지 않나.. 라는 정책적인 결정이 있을 수도 있을것 같습니다만,

    어디까지나 제 생각은 robot.txt는 robot.txt답게 쓰여야 한다는 것입니다.. ^^

답글을 남깁니다.

[로그인][오픈아이디란?]


[요즘에 쓴 글] [예전에 쓴 글]

(C)Milfy / neoocean.net, milfy@neoocean.net