sql - एक डेटाबेस के भीतर पता मानकीकरण



database ms-access (1)

यह एक मुश्किल व्यवसाय है ... समान भाग ब्लैक मैजिक और साइंस। आप अकेले बुलेवार्ड की विविधताओं पर आश्चर्यचकित होंगे।

यही कारण है कि मैं Google API का उपयोग करता हूं। प्रारंभिक डेटा-सेट के लिए यह समय लेने वाला हो सकता है, लेकिन केवल नए जोड़े को हल करने की आवश्यकता होगी।

उदाहरण के लिए

https://maps.googleapis.com/maps/api/geocode/json?address=500 S Main St,Providence RI 02903

रिटर्न, भाग में

"formatted_address" : "500 S Main St, Providence, RI 02903, USA"

और अच्छी खबर है

https://maps.googleapis.com/maps/api/geocode/json?address=500 South Main Steet,Providence RI 02903

पिछली क्वेरी के समान स्वरूपित पता लौटाता है

"formatted_address" : "500 S Main St, Providence, RI 02903, USA"

VBA उदाहरण:

निम्नलिखित कोड निष्पादित करने पर ...

' VBA project Reference required:
' Microsoft XML, v3.0

Dim httpReq As New MSXML2.ServerXMLHTTP
httpReq.Open "GET", "https://maps.googleapis.com/maps/api/geocode/json?address=500 South Main Steet,Providence RI 02903", False
httpReq.send
Dim response As String
response = httpReq.responseText

... स्ट्रिंग चर response में निम्नलिखित JSON डेटा शामिल हैं:

{
   "results" : [
      {
         "address_components" : [
            {
               "long_name" : "500",
               "short_name" : "500",
               "types" : [ "street_number" ]
            },
            {
               "long_name" : "South Main Street",
               "short_name" : "S Main St",
               "types" : [ "route" ]
            },
            {
               "long_name" : "Fox Point",
               "short_name" : "Fox Point",
               "types" : [ "neighborhood", "political" ]
            },
            {
               "long_name" : "Providence",
               "short_name" : "Providence",
               "types" : [ "locality", "political" ]
            },
            {
               "long_name" : "Providence County",
               "short_name" : "Providence County",
               "types" : [ "administrative_area_level_2", "political" ]
            },
            {
               "long_name" : "Rhode Island",
               "short_name" : "RI",
               "types" : [ "administrative_area_level_1", "political" ]
            },
            {
               "long_name" : "United States",
               "short_name" : "US",
               "types" : [ "country", "political" ]
            },
            {
               "long_name" : "02903",
               "short_name" : "02903",
               "types" : [ "postal_code" ]
            },
            {
               "long_name" : "2915",
               "short_name" : "2915",
               "types" : [ "postal_code_suffix" ]
            }
         ],
         "formatted_address" : "500 S Main St, Providence, RI 02903, USA",
         "geometry" : {
            "bounds" : {
               "northeast" : {
                  "lat" : 41.82055829999999,
                  "lng" : -71.4028137
               },
               "southwest" : {
                  "lat" : 41.8204014,
                  "lng" : -71.40319219999999
               }
            },
            "location" : {
               "lat" : 41.8204799,
               "lng" : -71.40300289999999
            },
            "location_type" : "ROOFTOP",
            "viewport" : {
               "northeast" : {
                  "lat" : 41.8218288302915,
                  "lng" : -71.40165396970851
               },
               "southwest" : {
                  "lat" : 41.8191308697085,
                  "lng" : -71.40435193029151
               }
            }
         },
         "partial_match" : true,
         "place_id" : "ChIJicPQAT9F5IkRfq2njkYqZtE",
         "types" : [ "premise" ]
      }
   ],
   "status" : "OK"
}

MS Access 2013 में कार्य करना। ऐसे स्थानों / पतों का एक टन होना चाहिए जिन्हें मानकीकृत करने की आवश्यकता है।

उदाहरण में पते शामिल हैं:

  • 500 डब्ल्यू मेन सेंट
  • 500 पश्चिम मुख्य सेंट
  • 500 वेस्ट मेन स्ट्रीट

तुम समझ गए।

मैंने एक ऐसी क्वेरी चलाने पर विचार किया है, जो सभी रिकॉर्ड्स को खींचती है जहां डेटाबेस में बाएं (7) या कुछ अक्षर एक से अधिक बार मौजूद हैं, लेकिन उस तर्क में स्पष्ट खामियां हैं।

क्या कोई फ़ंक्शन या क्वेरी या कुछ और है जो मुझे उन रिकॉर्डों की सूची बनाने में मदद करेगा जिनके पते कई बार मौजूद हो सकते हैं, थोड़ा अलग फैशन में?





standards