MySQL自然語言全文搜尋

2019-10-16 22:55:33

在本教學中,您將通過使用MATCH()AGAINST()函式來了解MySQL自然語言全文搜尋。

MySQL自然語言全文搜尋簡介

在自然語言全文搜尋中,MySQL查詢與自由文字自然人類語言查詢相關的行或文件,例如「如何使用MySQL自然語言全文搜尋」。

相關性是一個正浮點數。 當相關性為零時,這意味著沒有相似性。MySQL根據各種因素計算相關性,包括文件中的字數,文件中的唯一字數,集合中的單詞總數以及包含特定單詞的文件數(行)。

要執行自然語言全文搜尋,您可以使用MATCH()AGAINST()函式。 MATCH()函式指定要搜尋的列,AGAINST()函式確定要使用的搜尋表示式。

MySQL自然語言全文搜尋範例

我們將使用範例資料庫(yiibaidb)中的products表進行演示。

mysql> desc products;
+--------------------+---------------+------+-----+---------+------------------+
| Field              | Type          | Null | Key | Default | Extra            |
+--------------------+---------------+------+-----+---------+------------------+
| productCode        | varchar(15)   | NO   | PRI |         |                  |
| productName        | varchar(70)   | NO   |     | NULL    |                  |
| productLine        | varchar(50)   | NO   | MUL | NULL    |                  |
| productScale       | varchar(10)   | NO   |     | NULL    |                  |
| productVendor      | varchar(50)   | NO   |     | NULL    |                  |
| productDescription | text          | NO   |     | NULL    |                  |
| quantityInStock    | smallint(6)   | NO   |     | NULL    |                  |
| buyPrice           | decimal(10,2) | NO   |     | NULL    |                  |
| MSRP               | decimal(10,2) | NO   |     | NULL    |                  |
| stockValue         | double        | YES  |     | NULL    | STORED GENERATED |
+--------------------+---------------+------+-----+---------+------------------+
10 rows in set (0.22 sec)

首先,需要使用ALTER TABLE ADD FULLTEXT語句在products表的productLine列中啟用全文搜尋:

ALTER TABLE products 
ADD FULLTEXT(productline);

其次,可以搜尋產品系列包含Classic的產品,使用MATCH()AGAINST()函式,如下查詢:

SELECT productName, productline
FROM products
WHERE MATCH(productline) AGAINST('Classic');

執行上面查詢語句,得到以下結果 -

mysql> SELECT productName, productline
FROM products
WHERE MATCH(productline) AGAINST('Classic');
+-------------------------------------+--------------+
| productName                         | productline  |
+-------------------------------------+--------------+
| 1952 Alpine Renault 1300            | Classic Cars |
| 1972 Alfa Romeo GTA                 | Classic Cars |
| 1962 LanciaA Delta 16V              | Classic Cars |
| 1968 Ford Mustang                   | Classic Cars |
| 2001 Ferrari Enzo                   | Classic Cars |
| 1969 Corvair Monza                  | Classic Cars |
| 1968 Dodge Charger                  | Classic Cars |
| 1969 Ford Falcon                    | Classic Cars |
| 1970 Plymouth Hemi Cuda             | Classic Cars |
| 1969 Dodge Charger                  | Classic Cars |
| 1993 Mazda RX-7                     | Classic Cars |
| 1965 Aston Martin DB5               | Classic Cars |
| 1948 Porsche 356-A Roadster         | Classic Cars |
| 1995 Honda Civic                    | Classic Cars |
| 1998 Chrysler Plymouth Prowler      | Classic Cars |
| 1999 Indy 500 Monte Carlo SS        | Classic Cars |
| 1992 Ferrari 360 Spider red         | Classic Cars |
| 1985 Toyota Supra                   | Classic Cars |
| 1969 Dodge Super Bee                | Classic Cars |
| 1976 Ford Gran Torino               | Classic Cars |
| 1948 Porsche Type 356 Roadster      | Classic Cars |
| 1970 Triumph Spitfire               | Classic Cars |
| 1957 Corvette Convertible           | Classic Cars |
| 1957 Ford Thunderbird               | Classic Cars |
| 1970 Chevy Chevelle SS 454          | Classic Cars |
| 1970 Dodge Coronet                  | Classic Cars |
| 1966 Shelby Cobra 427 S/C           | Classic Cars |
| 1949 Jaguar XK 120                  | Classic Cars |
| 1958 Chevy Corvette Limited Edition | Classic Cars |
| 1952 Citroen-15CV                   | Classic Cars |
| 1982 Lamborghini Diablo             | Classic Cars |
| 1969 Chevrolet Camaro Z28           | Classic Cars |
| 1971 Alpine Renault 1600s           | Classic Cars |
| 2002 Chevy Corvette                 | Classic Cars |
| 1956 Porsche 356A Coupe             | Classic Cars |
| 1992 Porsche Cayenne Turbo Silver   | Classic Cars |
| 1961 Chevrolet Impala               | Classic Cars |
| 1982 Camaro Z28                     | Classic Cars |
+-------------------------------------+--------------+
38 rows in set

AGAINST()函式預設使用IN NATURAL LANGUAGE MODE搜尋修飾符,因此您可以在查詢中省略它。還有其他搜尋修飾符,例如IN BOOLEAN MODE用於布林文字搜尋

可以在查詢中顯式使用IN NATURAL LANGUAGE MODE搜尋修飾符,如下所示:

SELECT productName, productline
FROM products
WHERE MATCH(productline) 
AGAINST('Classic,Vintage' IN NATURAL LANGUAGE MODE);

執行上面查詢語句,得到以下結果 -

mysql> SELECT productName, productline
FROM products
WHERE MATCH(productline) 
AGAINST('Classic,Vintage' IN NATURAL LANGUAGE MODE);
+-------------------------------------------+--------------+
| productName                               | productline  |
+-------------------------------------------+--------------+
| 1937 Lincoln Berline                      | Vintage Cars |
| 1936 Mercedes-Benz 500K Special Roadster  | Vintage Cars |
| 1917 Grand Touring Sedan                  | Vintage Cars |
| 1911 Ford Town Car                        | Vintage Cars |
************ 此處省略了一大波資料 **************************
| 1971 Alpine Renault 1600s                 | Classic Cars |
| 2002 Chevy Corvette                       | Classic Cars |
| 1956 Porsche 356A Coupe                   | Classic Cars |
| 1992 Porsche Cayenne Turbo Silver         | Classic Cars |
| 1961 Chevrolet Impala                     | Classic Cars |
| 1982 Camaro Z28                           | Classic Cars |
+-------------------------------------------+--------------+
62 rows in set

預設情況下,MySQL以不區分大小寫的方式執行搜尋。但是,您可以指示MySQL使用二進位制排序規則對索引列進行區分大小寫搜尋。

按相關性排序結果集

全文搜尋的一個非常重要的特徵是MySQL根據其相關性對結果集中的行進行排序。 當WHERE子句中使用MATCH()函式時,MySQL返回首先更相關的行。

以下範例顯示了MySQL如何根據相關性對結果集進行排序。

首先,可以為products表的productName列啟用全文搜尋功能。

ALTER TABLE products 
ADD FULLTEXT(productName);

其次,使用以下查詢搜尋名稱包Ford和/或1932的產品:

SELECT productName, productline
FROM products
WHERE MATCH(productName) AGAINST('1932,Ford');

我們來檢視輸出結果:

mysql> SELECT productName, productline
FROM products
WHERE MATCH(productName) AGAINST('1932,Ford');
+-------------------------------------+------------------+
| productName                         | productline      |
+-------------------------------------+------------------+
| 1932 Model A Ford J-Coupe           | Vintage Cars     |
| 1932 Alfa Romeo 8C2300 Spider Sport | Vintage Cars     |
| 1968 Ford Mustang                   | Classic Cars     |
| 1969 Ford Falcon                    | Classic Cars     |
| 1940 Ford Pickup Truck              | Trucks and Buses |
| 1911 Ford Town Car                  | Vintage Cars     |
| 1926 Ford Fire Engine               | Trucks and Buses |
| 1913 Ford Model T Speedster         | Vintage Cars     |
| 1934 Ford V8 Coupe                  | Vintage Cars     |
| 1903 Ford Model A                   | Vintage Cars     |
| 1976 Ford Gran Torino               | Classic Cars     |
| 1940s Ford truck                    | Trucks and Buses |
| 1957 Ford Thunderbird               | Classic Cars     |
| 1912 Ford Model T Delivery Wagon    | Vintage Cars     |
| 1940 Ford Delivery Sedan            | Vintage Cars     |
| 1928 Ford Phaeton Deluxe            | Vintage Cars     |
+-------------------------------------+------------------+
16 rows in set

首先返回其名稱包含1932Ford的產品,然後返回名稱包含唯一Ford關鍵字的產品。

使用全文搜尋時,應該記住一些重點:

  • MySQL全文搜尋引擎中定義的搜尋項的最小長度為4,這意味著如果搜尋長度小於4的關鍵字,例如carcat等,則不會得到任何結果。
  • 停止詞被忽略,MySQL定義了MySQL原始碼分發storage/myisam/ft_static.c中的停止詞列表。

在本教學中,向您展示了如何使用MATCH()AGAINST()函式在MySQL中執行自然語言搜尋。