Cách ngăn Google lập chỉ mục nguồn cấp dữ liệu ở WordPress

toi-uu-file-robots-txt

Tôi thích tối ưu hóa blog dựa trên WordPress của tôi. Vấn đề duy nhất là, tôi hiếm khi có đủ thời gian để làm điều đó – và vẫn còn, có một số cải tiến nhỏ, có thể mất ít hơn 5 phút thời gian của bạn, và vẫn có một tác động hữu hình đến việc tối ưu hóa blog tổng thể của bạn.
Một trong những điều này là cách chúng tôi có thể ngăn Google (và các công cụ tìm kiếm khác) lập chỉ mục (tìm kiếm) các nguồn cấp dữ liệu WordPress RSS.
Một vài dòng tiếp theo sẽ được dành cho vấn đề này (và chúng ta có thể giải quyết nó như thế nào).

Bắt đầu từ đâu?

Tôi nhớ rằng một thời gian trước đây tôi đã được kiểm tra những trang của optimiced.com được lập chỉ mục trong Google.
Tôi đã bối rối vì thực tế là, bên cạnh bài đăng blog, tôi đã tìm thấy rất nhiều nguồn cấp dữ liệu RSS, cũng đã được lập chỉ mục.

Tại sao bạn không cần Google để lập chỉ mục / nhện RSS feeds?

Trước hết, nội dung được đánh chỉ mục (đã tìm kiếm) được nhân đôi – 10 bài đăng cuối cùng hoặc nhận xét cuối cùng, có sẵn qua RSS, có thể được đọc trên blog. Điểm thứ hai, RSS được sử dụng với trình đọc RSS, không được đọc trong cửa sổ trình duyệt (ví dụ: văn bản và hình ảnh) Cuối cùng, nhưng không kém phần quan trọng, ai muốn sau khi một tìm kiếm trên Internet được thực hiện để đưa vào một trang RSS chưa được định dạng với ý kiến, ví dụ, thay vì trên chính bài viết blog, mà các ý kiến ​​có liên quan? Và điều này đã xảy ra với tôi, và hơn một lần …

(Ví dụ: bạn có thể sử dụng liên kết này để đăng ký nguồn cấp dữ liệu RSS của blog của tôi, hoặc chỉ để kiểm tra mười bài đăng blog mới nhất từ ​​tối ưu hóa ở định dạng RSS).

Chúng ta có thể ngăn ngừa điều này xảy ra không?

Tôi đã tìm kiếm trên Internet một thời gian, cho đến khi cuối cùng tôi đã bỏ qua diễn đàn WordPress Support, nơi giải pháp được tìm thấy, và chính chủ đề, có tiêu đề “Ngăn chặn lập chỉ mục các trang nguồn cấp dữ liệu”, được đánh dấu là ‘đã giải quyết’.

Đây là cách để làm điều đó – bạn phải sử dụng tệp robots.txt.

Robots.txt là gì?

robots.txt graphic: Như bản thân tên cho thấy, robots.txt * là một tệp văn bản ở định dạng văn bản chuẩn (.TXT), được sử dụng bởi các robot 🙂

Tuy nhiên, không phải tất cả các robot, tất nhiên (ví dụ: Roomba không đếm ;-), nhưng chỉ bằng các máy tìm kiếm (nhện), như Google, Live Search (cho đến gần đây MSN Search), Yahoo !, Alta Vista và tất cả các tìm kiếm (ro) bots.

Với mục đích đó, bạn phải tạo một tệp tin trống mới và lưu nó dưới dạng một tệp văn bản đơn giản với tên robot và phần mở rộng .txt (tệp tin phải được đặt trong thư mục chính của trang web / blog

– ví dụ: để tối ưu hóa đây là https://rssletter.com/robots.txt).

toi-uu-file-robots-txt

Sau khi bạn đã tạo tệp tin văn bản, bạn phải sao chép & dán vào hai dòng sau:
Đại lý người dùng: *
Không cho phép: * / thức ăn /
Dòng đầu tiên với dấu hoa thị có nghĩa là quy tắc ở dòng kế tiếp sẽ được áp dụng cho tất cả các công cụ tìm kiếm; và thứ hai, Disallow: * / feed /, means, rằng tất cả URL, kết thúc bằng / feed /, không được lập chỉ mục (tìm kiếm).

Bởi vì trong trường hợp của tôi tôi sử dụng WordPress permalinks (liên kết vĩnh viễn) của kiểu Ngày & Tên dựa:
https://rssletter.com/bg/%year%/%monthnum%/%day%/%postname%/

… các nguồn cấp dữ liệu RSS cho blog của tôi là như sau:

https://rssletter.com/en/feed/

https://rssletter.com/en/name-of-category/feed/

https://rssletter.com/en/2018/03/16/title-of-post/feed/

(cuối cùng là một ví dụ về nguồn cấp dữ liệu RSS cho các nhận xét cho một bài đăng blog cụ thể).

Nếu blog của bạn sử dụng cấu trúc khác cho URL – ví dụ như phiên bản ‘ngắn’ (https://rssletter.com/en/?p=1234), các nguồn cấp dữ liệu RSS cho blog sẽ ở định dạng URL này :
https://rssletter.com/en/?feed=rss2
https://rssletter.com/en/?feed=comments-rss2
https://rssletter.com/en/?feed=rss2&cat=123
https://rssletter.com/en/?feed=rss2&p=1234.
Trong trường hợp này, tôi đoán, bạn nên thay đổi quy tắc trong tệp robots.txt thành:
Đại lý người dùng: *
Không cho phép: *? Thức ăn *
(Lưu ý: Kịch bản này không được tôi kiểm tra!)
Sau khi bạn thực hiện các thay đổi bắt buộc và đặt tệp robots.txt trên máy chủ, bạn sẽ phải đợi một vài ngày để xem hiệu quả dự định.

wp-rss-only-content

Đó là nó:
Phương pháp mô tả rất đơn giản và hoạt động tốt. Bởi vì tôi sử dụng Google Webmaster Tools, tôi có thể kiểm tra danh sách tất cả các URL được lập chỉ mục cho optimiced.com. Ngay sau khi tôi đã thêm hai dòng mã vào robots.txt, trong danh sách “URL bị hạn chế bởi robots.txt” xuất hiện tất cả các nguồn cấp dữ liệu RSS của tôi, chính xác như mong đợi. Tôi đoán, các công cụ tìm kiếm khác tuân theo các quy tắc tương tự, vì vậy bạn nên sử dụng robots.txt khá an toàn để ‘lọc’ các nguồn cấp dữ liệu RSS từ tìm kiếm.

Các ứng dụng khác của robots.txt

Tất nhiên, việc sử dụng robots.txt không giới hạn ở việc chỉ định nguồn cấp dữ liệu RSS – bạn có thể hạn chế, ví dụ như tìm kiếm trong một thể loại nhất định trong blog của bạn, và trong trường hợp này, danh mục này sẽ trở thành ‘ vô hình “cho các công cụ tìm kiếm. Bạn có thể hạn chế các phần khác của trang web của bạn (không nhất thiết phải là blog), chỉ bằng cách liệt kê chúng trong tệp robots.txt và thêm nhiều quy tắc vào tệp tin.

Robots.txt tìm thấy nhiều ứng dụng hơn trong thực tế, nhưng trong trường hợp này tôi chỉ muốn viết về chủ đề làm thế nào để làm cho blog WordPress của bạn gần hơn với sự hoàn hảo.

Chú thích cuối
Trong khi nghiên cứu nhỏ về đề tài này, tôi nghĩ về một cách khác để đạt được hiệu quả tương tự – bạn có thể đặt thuộc tính rel = “nofollow” trong liên kết nguồn cấp dữ liệu RSS. Nhưng điều này sẽ đòi hỏi phải chỉnh sửa mã của chủ đề WordPress của bạn và ở nhiều nơi.
Vì vậy, chắc chắn, cách robots.txt dễ dàng hơn nhiều.

Nguồn: optimiced

Really Simple Syndication (RSS)

RSS

RSS is rapidly replacing the form of email marketing and newsletters. You do not want to be left behind right? Your competitors will definitely surpass you and accelerate ahead. RSS is often referred to as Really Simple Syndication, and some words have the same initials but different meanings. It is a process where you can place an RSS feed on websites that can read the RSS format from your directory.

Simply put RSS, you can put your headlines on other websites for more people to see. In marketing, that is a concept that the more people you reach, the more your product is likely to be sold.
RSS is an XML-based application. In a way, XML is similar to HTML, an application that we all know is the most popular website creation application. From a directory, it will cite headers on websites that have an RSS reader. Creating an RSS feed will definitely boost your sales. How do you create RSS feeds? Follow these simple steps:
Create a file for the RSS feed, using a certain format, you must create the XML version of your path. It should include the title or title, the brief description of the content and the link where the file can be read. There are many different web-based RSS editor editors that you can use for it. Some programs only require you to write news and articles into a notepad file and when placed into the editor it will show the necessary format available for upload. It is recommended to create at least 10 articles for your RSS feed.
RSS

Save and download files

After creating your file, save it as an XML, RSS or RDF file. Now you are ready to upload it. Download the file using the FTP program and place it on the web server. This process now makes the file readable by RSS feeds.

Activate the file. Make sure the RSS program does not crash. RSS is compiling, so errors may not be seen. In addition, there are various programs that can assist you with this process. You will just need to put the RSS file that has been uploaded and saved to this program to check it avoids the tags and the lost or misleading code. It is important for you to check the process. This way you are sure that what you have is readable and can be used.

Create a folder

Now that you’ve finished creating the file, save it, and make sure it works, you’re ready to let others see it. The main purpose of an RSS feed is to distribute it to all RSS enabled sites. So go ahead and search for a directory where you can place your RSS feed. Some may require fees for uploading a directory. Some do this for free. Search and capture all the free sites you have and put it there. If you have some marketing budgets, you might want to sign up for a site with some cost. Do not forget to put an RSS feed link icon on your website, and even to those who visit you directly.

Updated frequently

With RSS, you know that the path changes automatically every time you change the main file. Do not leave your RSS feed there for a month without changing it. Maintain by adding new articles. The more attractive your subject, the more people will check your path and visit your website.

Creating an RSS feed for marketing on the Internet today is very simple. Even people who are not proficient in computers can create RSS feeds, based on the steps mentioned above. The applications created for RSS creation are applications that make it easy for everyday computer users to create an RSS feed. All you need is to be familiar with this process.

Start creating RSS feeds and give your competitors a competitive edge. Obviously, RSS feeds give your site more traffic than regular web hosting. And web traffic means that more people see your product and may be interested in purchasing them. Add strength to your marketing strategy and create RSS feeds and be ready to sell.

Nguồn translate: Marketing Internet Software & Design website

What is RSS – What language is RSS written in ?

rss letter

RSS – in a broad sense – is an internet technology that allows users to read the latest updates from one or more websites at once without going to the site directly. All they need is the internet and an RSS aggregator – the “aggregator” or simply the RSS reader (News reader, News aggregator).

RSS is not only beneficial to users but also means to promote the most economical website, without the need to use expensive advertising strategies.

Specifically – RSS stands for one of the following terms:
+ Really Simple Syndication: “The service is really simple.”
Rich Site Summary, RDF Site Summary: Rich Information Summary, RDF Information Summary
RDF – Resource Discovery Framework: is the format of the RSS 1.0 release. In some RDF web pages use instead of RSS.

RSS written in what language?

RSS is written in XML. Thus XML is also referred to as RSS in some websites. A rss file is simply a list of objects – the messages themselves – which are described as: the title, the content of the summary, and a link to the main page of the news. Other information such as date, author etc. can also be added.

A rss file does not have a consistent extension. The most common are: .xml, .rss, .rdf (there may be many extensions other than these 3 formats)

What are the versions of RSS?
The rss versions are: 0.90 and 0.91 (made by Netscape), 1.0 (by RSS-DEV), 0.9x and 2.0 (by UserLand Software).

Although there are many versions created by different vendors, most rss readers read them with every version. However, we do not care about counting this.

How to know if a website offers RSS Feed?
When you visit a website, try to look around the page with RSS icons. Like this:
If you have one of the icons above then click to go to the rss page

You can also go to the BlogStreet’s RSS Discovery tool, paste the url of the site to find rss. It will list the corresponding channels.

How to get rss from a website ?

You need a rss feeds reader like AmphetaDesk, NetNewsWire, and Radio Userland. You just select your favorite rss channel, drag the card into the program or copy the URL of the rss paste that into the url required by the reader.

+ Use browser that supports rss like: IE 7.0, Firefox 2.0, Opera 9.1

There are also online services that allow reading and archiving of rss feeds. Among them are Bloglines that are the most popular.

Want to embed your favorite rss on your own website?
Good Idea! But you need to see this article:
Feed2js – Convert RSS to javascript for embedded website

Websites offering RSS in Vietnam
+ Youth Online, Youth, Dan Tri, 24h.com.vn, vnexpress.net, conghung.com, and some forums like diendantinhoc.com, updatesofts.com ……

Some common terms
RSS: really simple syndication, rich site summary, RDF site summary (RDF content summary)

RDF: Resource Discovery Framework: Definition of rss 1.0

XML: eXtensible Markup Language

Rss file = rss feed = rss channel = feed = channel: news channel rss

Rss reader = News reader = RSS aggregator: Rss reader

Nguồn translate: support.digisoft