fume-manage-python.git

Merge branch 'master' of ssh://114.215.109.124:29418/fume-manage-python

zmc

2023-12-22 9fdbf60165db0400c2e8e6be2dc6e88138ac719a

Merge branch 'master' of ssh://114.215.109.124:29418/fume-manage-python

已添加4个文件

	core_modules/__pycache__/remove_duplicates_methods.cpython-38.pyc	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	core_modules/__pycache__/remove_duplicates_methods.cpython-39.pyc	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	core_modules/remove_duplicates_methods.py	66 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	main.py	898 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史

 core_modules/__pycache__/remove_duplicates_methods.cpython-38.pyc

Binary files differ

 core_modules/__pycache__/remove_duplicates_methods.cpython-39.pyc

Binary files differ

 core_modules/remove_duplicates_methods.py

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,66 @@
def remove_duplicates_dev_info (origin_data) :
    """å¯¹åå¥è®¾å¤ä¿¡æ¯è¡¨çæ°æ®å»é

    Args:
        origin_data (list): ç¬åçåå§æ°æ®

    Returns:
        list: å·²å»é¤éå¤çæ°æ®
    """
    has_removed_dup_dev_info=[]
    for item in origin_data :
        if item[1:4] not in ( [x[1:4] for x in has_removed_dup_dev_info] ) :
            has_removed_dup_dev_info.append(item)
    return has_removed_dup_dev_info










def remove_given_data_dev_info (wait_for_remove_list, sub_data ) :
    """wait_for_remove_listçåç´ [1:4]ä¸åå«sub_data,åå é¤è¯¥åç´ 

    Args:
        wait_for_remove_list (list): åå§åè¡¨,åç´ ä¾ç¶ä¸ºlistç±»å
        sub_data (list): æå®ååè¡¨

    Returns:
        temp: å é¤åçæ°æ®
    """
  
    temp = []
    for item in wait_for_remove_list :
        if item[1:4] != sub_data :
            temp.append(item)
    return temp









# list_test1=['32','è¡¡æºè¿ç§æï¼æ·±å³ï¼æéå¬å¸', 'é¦¨è¿ç¾é£å°éï¼åå°¼ç¾é£å¹¿åºï¼','hengzhiyuan_64480047078091','']
# list_test2=['f','è¡¡æºè¿ç§æï¼æ·±å³ï¼æéå¬å¸', 'é¦¨è¿ç¾é£å°éï¼åå°¼ç¾é£å¹¿åºï¼','hengzhiyuan_64480047078091','']
# list_test3=['gf','è¡¡æºè¿ç§æï¼æ·±å³ï¼æéå¬å¸', 'é¦¨è¿ç¾é£å°éï¼åå°¼ç¾é£å¹¿åºï¼','hengzhiyuan_64480047078091','']
# list_test4=['ds','è¡¡æºè¿ç§æï¼æ·±å³ï¼æéå¬å¸', 'é¦¨è¿ç¾é£å°éï¼åå°¼ç¾é£å¹¿åºï¼','hengzhiyuan_64480047078091','']
# list_test5=['a','è¡¡æºè¿ç§æï¼æ·±å³ï¼æéå¬å¸', 'é¦¨è¿ç¾é£å°éï¼åå°¼ç¾é£å¹¿åºï¼','hengzhiyuan_64480047078091','']
# list_test6=['df','è¡¡æºè¿ç§æï¼æ·±å³ï¼æéå¬å¸', 'é¦¨è¿ç¾é£å°éï¼åå°¼ç¾é£å¹¿åºï¼','hengzhiyuan_64480047078091','']

# list_all=[]
# list_all.append(list_test1)
# list_all.append(list_test2)
# list_all.append(list_test3)
# list_all.append(list_test4)
# list_all.append(list_test5)
# list_all.append(list_test6)


# print(remove_duplicates_dev_info(list_all))

 main.py

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,898 @@
#sum å¤é¡µ å¥åºæå ç¬åæä»¶ä¸ææçåºéº  ç½é¡µå®æ´è¡¨ç«¯ å»é¤éå¤æ°æ® éå°ç©ºé¡µé¢ä¼è·³å°ä¸ä¸å®¶åºéº ãéå°æå®¶åºéºæ æ°æ®ï¼è·³è¿å»ä¸ä¸å®¶
#ç¬å»æå®¶åºéºæå®çé¡µæ°ï¼ä¸é¡µè®°å½æ°é»è®¤å¤§å°ä¸º100æ¡ï¼ï¼æ¯å¦ç¬å12é¡µï¼åç¬å12é¡µåå°ç»æä¸æ¬¡æ§åå¥æ°æ®åº
#ç¬å»æ´ä¸ªé¡µé¢è¡¨ç»æï¼ååå«åå¥4å¼ è¡¨ä¸ï¼ç¬åçæ°æ®åå¥ä¸¤å¼ è¡¨ä¸ï¼è¿æè¶æ è¡¨ å¼å¸¸è¡¨ï¼
#ç½é¡µä¸åæ®µå±14ä¸ªï¼åå¥æ°æ®åºæ¯15ä¸ªï¼åºå·+14ï¼
import requests
from bs4 import BeautifulSoup as bs  
from aip import AipOcr  #ç¾åº¦æåè¯å«
import re              #æ£åè¡¨è¾¾å¼
from pymysql import *  # è¿æ¥mysqlæ°æ®åº
import pandas as pd
from sqlalchemy import create_engine
import urllib.parse                   #urlåéç¼ç 
import time
import uuid
from datetime import datetime, timedelta

import sys
sys.path.append('D:\\z\workplace\\VsCode\\show')
import core_modules.remove_duplicates_methods as rdm


now_date = time.strftime("%Y-%m-%d", time.localtime())    #è·åå½åå¹´ææ¥  #urlç¼ç å¹´ææ¥å¼å§é»è®¤æ¶é´
now_date1 = time.strftime("%Y-%m", time.localtime())  
month_begin=now_date1+'-01'                 #è®¾ç½®å½åæä»½çå¼å§

list_temp=[]  #ä¸´æ¶åè¡¨  å¨å±åé



def remove_Duplicates_list(list):        #åè¡¨èªèº«å»é
    global already_spider_datanum
    list_store=[]
    for item in list:
        if item not in list_store:
            list_store.append(item)
        else:
            print("åç°éå¤")
            already_spider_datanum=already_spider_datanum-1
    #print(list_store)
    return list_store

def merge(list):  #åå¹¶liståæ°åä¸ªåç´  
    date_1=str(list.pop(-1))  #å é¤å°¾åç´ åè¿è½ç»§ç»ä½¿ç¨æ¹åç´ ï¼
    date_2=str(list.pop(-1))
    date1=date_2+' '+date_1       #åå¹¶ä¸ºå¹´ææ¥æ¶åç§

    date_3=str(list.pop(-1))  
    date_4=str(list.pop(-1))
    date2=date_4+' '+date_3

    date_5=str(list.pop(-1))
    date_6=str(list.pop(-1))
    date3=date_6+' '+date_5
    list.append(date3)    #å°åå¹¶çæ°æ®åä¼liståè¡¨ç»å°¾.
    list.append(date2)      
    list.append(date1)
    
    
    return list

def list_url(url,page_num):  #urlä¸çiæ¯é¡µ ,apge_numè¡¨ç¤ºç¬åçé¡µæ°  ãurlåé¢å ä¸é¡µçåæ°
    urls = [url+'&page'+'={}'.format(str(i)) for i in range(1,page_num+1)]
    return urls    # è¿åè¯¥urlå¯¹åºé¡µçææé¾æ¥å½¢å¼ï¼è¿åå¼ä¸ºåè¡¨


def get_OnePage(url,count):     #æåä¸é¡µçæ°æ®,æ¾å¥list_dataä¸.urlsä¸ºè¦è®¿é®çç½é¡µå°å
    global ck
    global list_temp    #ä½¿ç¨å¨å±åé

    list_temp.clear()  #æ¸ç©ºä¸´æ¶è¡¨
    headers = {
        # æ¤å¤æ³¨æcookieï¼è¦èªå·±æå
        "Cookie":ck,
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36",
    }
    r = requests.get(url=url, headers=headers, verify=False).text
    soup = bs(r,'html.parser')

    list=[]                     #åå»ºåè¡¨æ¥ä¿åç»æ
    tags = soup.find_all("tr")  # åè¡¨ææè¡
    for tag in tags:  # æ¯ä¸ªtagæ¯ä¸è¡
        count=count+1
        element = tag.text  # è·å<tr>æ ç¾åææææ¬ä¿¡æ¯
        element = element.strip()  # å°åç¬¦ä¸²é¦å°¾ç©ºæ ¼å»é¤
        list1 = element.split();  # ä»¥ç©ºæ ¼ä¸ºåéå°åç¬¦ä¸²åä¸ºåè¡¨

        del (list1[-2:])            #åè¡¨æåä¸¤ä¸ªåç´ ä¸éè¦,å é¤
        list1.insert(3,'')
        list.append(list1)     #listä¿åææè¡

    #print(list) 
    
    
    list_data=[]    #ä¿ååå¹¶æ¥æçä¸é¡µæ°æ®
    for i in list:                       
        list_data.append(merge(i))    #å·²å°å°¾æ¥ææ°æ®åå¹¶æå¹´ææ¥ æ¶åç§  æ¤æ¶å½¢æå®æ´çæ°æ®. 
       
    del list_data[0]          #å é¤æåè¡¨å¤´ 
    count=count-1             #å é¤äºè¡¨å¤´,æ»æ°æ®çè¡æ°åä¸
    #list_removeD= remove_Duplicates_list(list_data)     #list_dateä¿åçæ¯ä¸é¡µçæ°æ® 
    
    #print(list_data)
    list_temp=list_data[:]
    #list_temp=remove_Duplicates_list(list_data)[:]    #å°ä¸é¡µæææ°æ®å¤å¶ç»ä¸´æ¶åè¡¨list_temp   æ¯å»é¤éå¤åçåè¡¨
    return count



def get_MorePages(url,page_num):   #ç¬åæå®åºéºåçå¤é¡µæ°æ®,apge_numè¡¨ç¤ºç¬åçé¡µæ°
    global sleeptime
    global already_spider_datanum
    urls=list_url(url,page_num)   #å¾å°éè¦éåçé¡µçurl
    count_all=0          #ä¿åæ°æ®çæ»è¡æ°
    list_all=[]          #ä¿åç¬åçææçæ°æ®
    page=1
    for i in urls:
        count=0
        count_all=count_all+get_OnePage(i,count)
        if len(list_temp)==0:        #å¦æè¯¥é¡µä¸ºç©ºï¼åè¡¨ç¤ºè¯¥é¡µåé¢é½æ æ°æ®  éåºå¾ªç¯
            print('åé¢é¡µæ°ä¸ºç©ºï¼ç¬å»ä¸ä¸ä¸ªåºéº')
            break                    #éåºå¾ªç¯
        list_all.extend(list_temp)   #å°ä¸é¡µæ°æ®åè¡¨è¿½å å°list_allä¸
        print("ç¬åäºç¬¬",page,"é¡µ")
        page=page+1
        print("\n")
        time.sleep(sleeptime)         #é´é2ç§è¯·æ±ä¸æ¬¡

    for j in list_all:
        print(j)              #æå°åè¡¨ä¸æ¯ä¸è¡
    print("æ»è¡æ°ä¸º:",count_all)
    already_spider_datanum += count_all #å·²ç¬åæ°æ®çæ»å

    return list_all    
    #return remove_Duplicates_list(list_all)   #åæ¬¡å¯¹åè¡¨è¿æ»¤éå¤


def url_more(): #è¿åæä»¶ä¸éºåç¼ç å½¢æurl,è¿åå¼æ¯urlåè¡¨     é»è®¤æ¥çç½é¡µçæå¤§æ¾ç¤ºæ¡æ°100
    global shopnum
    shopnames = []  #ä¿åä¸æåºéºåç§°
    with open("D:\\z\\workplace\\shopname.txt",encoding='utf-8') as file:    #å°æä»¶ä¸åºéºååä¿åå°åè¡¨ä¸
        for line in file:
            line = line.strip() #or some other preprocessing
            shopnames.append(line) #storing everything in memory!
    #print(type(shopnames[0]))
    #ç¼ç 
    shopnum=len(shopnames)   #æä»¶ä¸åºéºæ»æ°
    shopname_encoding=[]  #ä¿åç¼ç åçåºéºåç§°
    i=0
    for name in shopnames:
        shopname_encoding.append(urllib.parse.quote(urllib.parse.quote(shopnames[i]))) #åºéºåç§°è¿è¡åéurlç¼ç 
        i=i+1
    #æ¼æ¥ç½åå½¢æå¯ç¨çurl
    urls=[]  #ä¿åæ¼æ¥åçurl
    for shop in shopname_encoding:
        url='http://xhhb.senzly.cn/sys/yyRealTimeValue_list.jsp?key1=&shop='+shop+'&pagesize=100'
        urls.append(url)
    # for i in urls:   
    #     print(i)
    return urls   #è¿åæä»¶ä¸åºéºåç§°å¯¹åºçurl

#æ ¹æ®å¼å§åç»ææ¥ææ¥æ¼æ¥url
def url_add_time(url,date_begin=month_begin,date_end=now_date):     #url,å¹´-æ-æ¥ 2023-05-03
    url_date=url+'&key5='+date_begin+'&key6='+date_end
    print(url_date)
    return url_date

#------------------------------------------------------------------------------------------------------------è¶æ æ²¹çæ°æ®åå¥å¼å¸¸è¡¨ä¸
#ä¸¤æ¶é´æ¯å¦ç¸å·®10åé  æ¯åè¿åTRUE å¦åè¿åFALSE
def is_time_difference_equals_10_mins(datestr1, datestr2):    
    date1 = datetime.strptime(datestr1, "%Y-%m-%d %H:%M")
    date2 = datetime.strptime(datestr2, "%Y-%m-%d %H:%M")
    time_diff = date2 - date1

    return time_diff == timedelta(minutes = 10) or time_diff == timedelta(minutes = -10) #timedelta() è¡¨ç¤ºä¸¤ä¸ª date å¯¹è±¡æè time å¯¹è±¡,æè datetime å¯¹è±¡ä¹é´çæ¶é´é´é


#æ¯éååéä¸æ¬¡ä¸ºæ£å¸¸ã æ¾åºè¶è¿10åéçé´æç¹
def find_break_point(list): #listä¸ºè¶æ æ°æ®çåè¡¨
    i=0
    j=1
    break_point = []     #ä¿åé´æç¹
    for item in list[1:]:  
        if(is_time_difference_equals_10_mins(list[i][2],item[2]) == False): 
            break_point.append(j) 
        i=i+1
        j=j+1
    print('é´æç¹ä¸ºï¼')
    print(break_point)

    #åå¥é´æç¹
    return break_point
    

    
#æ ¹æ®é´æç¹å°åè¡¨åå²æå ä¸ªååè¡¨ï¼ç±resultè¿å
def point_write(list,b_point):   #listä¸ºåè¡¨ãb_pointåè¡¨åç´ ä¸ºé´æç¹ï¼é´æç¹å¼ä»å°å°å¤§
    result = []
    last_index = 0
    for index in b_point:
        result.append(list[last_index:index])   #çµæ´»
        last_index=index
    result.append(list[last_index:])
    return result


#å°è®¾å¤æéä¿¡æ¯åå¥abnormal_dataå¼å¸¸è¡¨ä¸ 
def abnormal_write_to_SQL(list,con): 
    data = pd.DataFrame(list,columns=['dev_id','exception','exception_type','region','begin_time','end_time'])
    print("\n\n")
    print(data)
    # engine = create_engine("mysql+mysqlconnector://root:1234@localhost:3306/qianduan_sql?charset=utf8")
    # con = engine.connect()

    # test3 è¦åå¥çæ°æ®è¡¨ï¼è¿æ ·åçè¯è¦æåå¨æ°æ®åºå»ºå¥½è¡¨
    data.to_sql(name="abnormal_data", con=con, if_exists="append",index=False,index_label=False)
    # con.close()
    
    

def exception(list,con):   #listä¸ºè¶æ æ°æ®çåè¡¨
    break_point=find_break_point(list) #è¿åé´æç¹
    split_list=point_write(list,break_point) #æ ¹æ®é´æç¹å°åå§åè¡¨åå²æå ä¸ªååè¡¨  split_listä¸ºä¸å±æ°ç»,å½¢å¼ä¸º[[[1,2],[4,'g']],[[8,'2'],['4','g']],[[1,2],[4,'g']]]
    # print('è¶æ æ¶é´æ®µååæçååè¡¨ä¸ºï¼ï¼')
    # for i in split_list:
    #     print(i)
    print('\n')
    abnormal=[]     #éç»å¥½çå¼å¸¸è¡¨æ°æ®

    for item in split_list:    #ä»åå²çæ°ç»ä¸æåéè¦çæ¶é´ä¿¡æ¯ï¼å¹¶æ·»å æ°çä¿¡æ¯æ°æ®
        temp=[]  
        temp.append(item[0][0])  #è®¾å¤ç¼å·
        temp.append('æ°æ®å¼å¸¸')  #è®¾å¤ç¼å·
        temp.append('0')  #æ²¹çæµåº¦è¶æ 
        temp.append('å¾æ±åº')
        temp.append(item[len(item)-1][2])  #åä¸æ¡è®°å½çå½å±æ¶é´  å¼å§æ¶é´
        temp.append(item[0][2])  #å½å±æ¶é´  ç»ææ¶é´
        abnormal.append(temp)

        print(abnormal)

    print('è¶æ å¼å¸¸æ¶é´æ®µæ°æ®ä¸ºï¼')
    for j in abnormal:
        print(j)
    abnormal_write_to_SQL(abnormal,con) #åå¥å¼å¸¸è¡¨ä¸
    print("è¶æ æ²¹çæ°æ®å¼å¸¸è¡¨åå¥å®æ!")

#------------------------------------------------------------------------------------------------------------è®¾å¤æéæ°æ®åå¥å¼å¸¸è¡¨ä¸
#ä¸¤æ¶é´æ¯å¦ç¸å·®30åé  æ¯åè¿åTRUE å¦åè¿åFALSE
def is_time_difference_equals_30_mins(datestr1, datestr2):    
    date1 = datetime.strptime(datestr1, "%Y-%m-%d %H:%M")
    date2 = datetime.strptime(datestr2, "%Y-%m-%d %H:%M")
    time_diff = date2 - date1
    return time_diff > timedelta(minutes=30) 

#æ¾åºè®¾å¤æéçä¿¡æ¯ï¼å¹¶å°æ¤ä¿¡æ¯åå¥å¼å¸¸è¡¨ä¸
def is_minutes_exceed_30(list,con) :   # listä¸ºæåºéºæå®é¡µæ°çå¨é¨çè®°å½ liståç´ ä¸çæ¶é´ä¸ºååºæåï¼å³ä»å¤§å°å°
    device_failure=[]     #åå¨è®¾å¤æéçæ°æ®
    startTime = list[0][11]
    print('å¼å§æ¶é´ï¼',startTime)
    for item in list[1:] :
        if is_time_difference_equals_30_mins(item[11],startTime) :  #å¿é¡»å¤§äº30åé ä¸è½çäº30åé
            temp=[] 
            temp.append(item[2])  #è®¾å¤ç¼å·
            temp.append('è®¾å¤æé')  #è®¾å¤ç¼å·
            temp.append('1') #è®¾å¤æé
            temp.append('å¾æ±åº')
            temp.append(item[11])    #æéå¼å§æ¶é´
            startTimeSub= datetime.strptime(startTime,"%Y-%m-%d %H:%M") - timedelta(minutes = 10) #ç»æä¸ºdatetime.datetimeç±»å ï¼éè¦åè½¬ä¸ºåç¬¦ä¸²ç±»å
            print('ç¸ååç»æï¼',str(startTimeSub))
            print('ç¸ååç±»åï¼',type(str(startTimeSub)))
            temp.append(str(startTimeSub)[:16])  #æéç»ææ¶é´
            device_failure.append(temp)
        startTime = item[11]
    print('è®¾å¤æéçæ°æ®ä¸ºï¼')
    for i in device_failure :
        print(i)
    not_Key_period_exceed_30_minutes(device_failure,con)  #å°ä¾çµå¼å¸¸ä¿¡æ¯åå¥å¼å¸¸è¡¨
    #abnormal_write_to_SQL(device_failure,con)   #å°è®¾å¤æéä¿¡æ¯åå¥å¼å¸¸è¡¨
    print('ä¾çµå¼å¸¸/æçº¿ä¿¡æ¯åå¥å¼å¸¸è¡¨å®æ!')
#-----------------------------------------------------------------------------------------------------------ä¾çµå¼å¸¸æ°æ®åå¥å¼å¸¸è¡¨ä¸
#å¼å§åç»ææ¶é´é½å¤äºééç¹æ¶æ®µæ¶,è¿åtrue
def is_time_not_between_key_period(begin_time,end_time) :  #å½¢åä¸ºæ¥æåç¬¦ä¸²,å½¢å¦ '2023-06-21 14:30'
    global Key_period_noon_begin,Key_period_noon_end,Key_period_night_begin,Key_period_night_end
    # #ä¸åéç¹æ¶æ®µ
    # Key_period_noon_begin = datetime.strptime('10:00',"%H:%M")
    # Key_period_noon_end = datetime.strptime('14:00',"%H:%M")

    # #æä¸éç¹æ¶æ®µ
    # Key_period_night_begin = datetime.strptime('17:00',"%H:%M")
    # Key_period_night_end = datetime.strptime('21:00',"%H:%M")

    begin1 = datetime.strptime(begin_time[11:],"%H:%M")
    end1 = datetime.strptime(end_time[11:],"%H:%M")

    #å½å¼å§åç»ææ¶é´é½å¤äºééç¹æ¶æ®µæ¶ï¼å°è¯¥æ¡æéä¿¡æ¯åæ¶è®°å½ä¸ºï¼ çä¼¼ä¾çµå¼å¸¸
    if ((( begin1 > Key_period_noon_begin and begin1 < Key_period_noon_end ) or ( begin1 > Key_period_night_begin and begin1 < Key_period_night_end )) or (( end1 > Key_period_noon_begin and end1 < Key_period_noon_end ) or ( end1 > Key_period_night_begin and end1 < Key_period_night_end ))) ==False :
        print('å¼å§æç»ææ¶é´æ¶é´å¨ééç¹æ¶æ®µ')
        return True
    print('å¤äºéç¹æ¶æ®µ')
    return False

#å¼å§åç»ææ¶é´é½å¤äºéç¹æ¶æ®µæ¶,è¿åtrue
def is_time_between_key_period(begin_time,end_time) :  #å½¢åä¸ºæ¥æåç¬¦ä¸²,å½¢å¦ '2023-06-21 14:30'
    global Key_period_noon_begin,Key_period_noon_end,Key_period_night_begin,Key_period_night_end
    # #ä¸åéç¹æ¶æ®µ
    # Key_period_noon_begin = datetime.strptime('10:00',"%H:%M")
    # Key_period_noon_end = datetime.strptime('14:00',"%H:%M")

    # #æä¸éç¹æ¶æ®µ
    # Key_period_night_begin = datetime.strptime('17:00',"%H:%M")
    # Key_period_night_end = datetime.strptime('21:00',"%H:%M")

    begin1 = datetime.strptime(begin_time[11:],"%H:%M")
    end1 = datetime.strptime(end_time[11:],"%H:%M")

    #å½å¼å§åç»ææ¶é´é½å¤äºéç¹æ¶æ®µæ¶ï¼å°è¯¥æ¡æéä¿¡æ¯åæ¶è®°å½ä¸ºï¼ æçº¿
    if ((begin1 > Key_period_noon_begin and begin1 < Key_period_noon_end) and ( end1 > Key_period_noon_begin and end1 < Key_period_noon_end )) or ( (begin1 > Key_period_night_begin and begin1 < Key_period_night_end) and ( end1 > Key_period_night_begin and end1 < Key_period_night_end )) :
        print('å¼å§æç»ææ¶é´å¤äºéç¹æ¶æ®µ')
        return True
    print('å¤äºééç¹æ¶æ®µ')
    return False



def not_Key_period_exceed_30_minutes(list,con) :  #listä¸ºè®¾å¤æéçæ¶é´æ®µæ°æ®
    power_supply_abnormal = []  #ä¿åä¾çµå¼å¸¸ææçº¿çä¿¡æ¯
    for item in list :
        if is_time_not_between_key_period(item[4],item[5]) :   #else:
            temp = []
            temp.append(item[0])
            temp.append('è®¾å¤æé')
            temp.append('1')  #çä¼¼ä¾çµå¼å¸¸
            temp.append('å¾æ±åº')
            temp.append(item[4])
            temp.append(item[5])
            power_supply_abnormal.append(temp)
        elif is_time_between_key_period(item[4],item[5]) :
            temp = []
            temp.append(item[0])
            temp.append('è®¾å¤æé')
            temp.append('2')  #æçº¿
            temp.append('å¾æ±åº')
            temp.append(item[4])
            temp.append(item[5])
            power_supply_abnormal.append(temp)
    print('ä¾çµå¼å¸¸çæ°æ®ä¸ºï¼')
    for i in power_supply_abnormal :
        print(i)
    
    #å°ä¾çµå¼å¸¸çä¿¡æ¯åå¥æ°æ®åºå¼å¸¸è¡¨ä¸
    abnormal_write_to_SQL(power_supply_abnormal,con)   #å°è®¾å¤æéä¿¡æ¯åå¥å¼å¸¸è¡¨
    print('ä¾çµå¼å¸¸çä¿¡æ¯åå¥å¼å¸¸è¡¨å®æ!')



#------------------------------------------------------------------------------------------------------------åå¥è¶æ è¡¨ä¸

#è¿åéç»åçåè¡¨
def refind_ex(list):  #listä¸ºç½é¡µçä¸æ¡è®°å½
    temp=[]
    temp.append(list[2])  #è®¾å¤ç¼å·
    temp.append(list[12]) #ä¸æ¥æ¶é´
    temp.append(list[11])  #å½å±æ¶é´
    temp.append(list[6])   #é£æºçµæµ 6
    temp.append(list[7])   #ååå¨çµæµ7
    temp.append(list[4])   #è¿æ²¹çæµåº¦å¼
    temp.append(list[5])   #ææ²¹çæµåº¦å¼

    print(temp)
    return temp


#å°åè¡¨åå¥exceeding_st_dataè¡¨ä¸ 
def ex_write_to_SQL(list,con): 
    data = pd.DataFrame(list,columns=['MV_Stat_Code','MV_Create_Time','MV_Data_Time','MV_Fan_Electricity','MV_Purifier_Electricity','MV_Fume_Concentration','MV_Fume_Concentration2'])
    print("\n\n")
    print(data)
    #engine = create_engine("mysql+mysqlconnector://root:1234@localhost:3306/qianduan_sql?charset=utf8")
    #con = engine.connect()

    # test3 è¦åå¥çæ°æ®è¡¨ï¼è¿æ ·åçè¯è¦æåå¨æ°æ®åºå»ºå¥½è¡¨
    data.to_sql(name="exceeding_st_data", con=con, if_exists="append",index=False,index_label=False)
    #con.close()
    print("è¶æ è¡¨åå¥å®æ!")
    

# listä¸ºæåºéºæå®é¡µæ°çå¨é¨çè®°å½ å°è¶æ æ°æ®åå¥è¶æ è¡¨
def isExceeding(list,con):  #listä¸ºæåºéºæå®é¡µæ°çå¨é¨çè®°å½  liståç´ ä¸ºåè¡¨å½¢å¼
    exceedingData=[]     #ä¿åè¶æ çæ°æ®
    for item in list:       #æ¥æ¾è¶æ çæ°æ®ï¼å¹¶è®°å½ä¸
        if float(item[5]) > 1:   # æçæµåº¦å¤§äº1åè¶æ 
            print("è¯¥æ¡æ°æ®è¶æ ")
            #ä¿åè¯¥æ¡è®°å½ï¼æåéè¦çå¼ï¼å¹¶æ·»å å¶ä»åæ®µ
            exceedingData.append(refind_ex(item))
            
            
    for i in exceedingData:  #éååè¡¨
        print(i)   

    if(len(exceedingData) != 0) :  #æè¶æ æ°æ®æ¶ææ§è¡
        #å°è¶æ æ°æ®æ¶é´åç±»ååabnormal_dataå¼å¸¸è¡¨ä¸
        exception(exceedingData,con) 

        #å°è¶æ æ°æ®ç´æ¥åå¥æ°æ®åºè¶æ è¡¨ä¸  
        ex_write_to_SQL(exceedingData,con)
    else:
        print('è¯¥åºéºæ è¶æ æ°æ®')


#------------------------------------------------------------------------------------------------------------æ°æ®åå¥è®¾å¤ä¿¡æ¯è¡¨
def generate_short_uuid():
    arrayOf=[
            "a",
            "b",
            "c",
            "d",
            "e",
            "f",
            "g",
            "h",
            "i",
            "j",
            "k",
            "l",
            "m",
            "n",
            "o",
            "p",
            "q",
            "r",
            "s",
            "t",
            "u",
            "v",
            "w",
            "x",
            "y",
            "z",
            "0",
            "1",
            "2",
            "3",
            "4",
            "5",
            "6",
            "7",
            "8",
            "9",
            "A",
            "B",
            "C",
            "D",
            "E",
            "F",
            "G",
            "H",
            "I",
            "J",
            "K",
            "L",
            "M",
            "N",
            "O",
            "P",
            "Q",
            "R",
            "S",
            "T",
            "U",
            "V",
            "W",
            "X",
            "Y",
            "Z"
        ]
    list=[]
    ui=str(uuid.uuid4()).replace('-', '')
    for i in range(0,16):
        a1=ui[i*2:i*2+2]
        x=int(a1,16)
        list.append(arrayOf[x % 0x3E])
    return ''.join(list)


#è¿åéç»åçåè¡¨
def refind_ea(list):  #ä¸æ¡è®°å½ï¼ä¹å°±æ¯ä¸ä¸ªåè¡¨
    temp=[]
    temp.append(generate_short_uuid())
    temp.append(list[2])
    temp.append(list[1])
    temp.append(list[0])
    temp.append(1)
    print(temp)
    return temp

#å°åè¡¨åå¥è®¾å¤ä¿¡æ¯è®¾å¤ä¿¡æ¯ea_t_devè¡¨ä¸ 
def ea_write_to_SQL(list,con):   
    data = pd.DataFrame(list,columns=['DI_GUID','DI_Code','DI_Name','DI_Supplier','DI_Online'])
    print("\n\n")
    print('åå¥æ°æ®è¡¨ ï¼DateFrameä¸ºï¼',data)

    # test3 è¦åå¥çæ°æ®è¡¨ï¼è¿æ ·åçè¯è¦æåå¨æ°æ®åºå»ºå¥½è¡¨
    data.to_sql(name="ea_t_device_info", con=con, if_exists="append",index=False,index_label=False)
    print("è®¾å¤ä¿¡æ¯è¡¨åå¥å®æ!")


def dev_info_data_if_exisitd(list,con):  #listä¸ºç¬åæå®¶åºéºæå®é¡µæ°è½¬æ¢åçæ°æ®
    global con_read
    #åå»ºç¬¬äºä¸ªæ°æ®åºè¿æ¥
    # engine = create_engine("mysql+mysqlconnector://root:1234@localhost:3306/qianduan_sql?charset=utf8")
    # con_read = engine.connect()

    df = pd.read_sql('SELECT DI_Code,DI_Name,DI_Supplier FROM ea_t_device_info',con=con_read)   #ä»è®¾å¤ä¿¡æ¯è¡¨ä¸è¯»åè®¾å¤ç¼å·ï¼åºéºåï¼ä¾åºååæ®µçæ°æ®ãè¿åå¼æ¯DateFrameç±»å
    # con_read.close()  #å³éé¾æ¥

    res = df.values.tolist()  #DateFrameæç§è¡è½¬ælistç±»åï¼resåæ¾çæ¯è®¾å¤ä¿¡æ¯è¡¨ä¸çæ°æ®
    print('******** è®¾å¤ä¿¡æ¯******')
    for i in res:
        print(i)
    print('è®¾å¤ä¿¡æ¯è¡¨è®°å½æ¡æ°ä¸ºï¼',len(res))

    list1 = rdm.remove_duplicates_dev_info(list)  #è®¾å¤ç¼å·ï¼åºéºåï¼ä¾åºåç¸çæ¶ï¼åä¸ºéå¤ï¼å»é¤ãlist1ä¸ºå»éåç
    if len(res) > 0 :  #è®¾å¤è¡¨ä¸ææ°æ®
        #æ¯è¾
        temp=list1[:]  #å°list1æ°æ®ç»tempï¼éåtemp,è¥ç¸çï¼ä»listä¸å é¤æ°æ®ï¼é¿åä¸ä¸ªåè¡¨åæ¶éåä¸å é¤
        print('å»é¤éå¤ä¸º:')
        print(list1)
        for item in temp:
            if item[1:4] in ( x[:] for x in res ) :  #å¾åå¥æ°æ®åºçå¼ä¸è®¾å¤è¡¨ä¸æ°æ®ç¸çæ¶,å°å¾åå¥çå¼ä»listä¸ç§»é¤               
                list1=rdm.remove_given_data_dev_info(list1,item[1:4])   #è¯¥itemä»list1ä¸ç§»é¤
                   
        print('è®¾å¤ä¿¡æ¯è¡¨ä¸ææ°æ®æ¶ï¼å»éåçlistä¸ºï¼',list1)
        if( len(list1) != 0 ) :  #å é¤åä¸ä¸ºç©ºæ¶ï¼åå¥ 
            ea_write_to_SQL(list1,con)   #å°åè¡¨åå¥ea_t_devè¡¨ä¸ 
    else :      #è®¾å¤è¡¨ä¸æ æ°æ®
        # a=rdm.remove_duplicates_dev_info(list)  #è®¾å¤ç¼å·ï¼åºéºåï¼ä¾åºåç¸çæ¶ï¼åä¸ºéå¤ï¼å»é¤
        print('è®¾å¤è¡¨æ æ°æ®ï¼å¤çåå¾åå¥çè®¾å¤ä¿¡æ¯ä¸ºï¼',list1) 
        #å°å»éåæ°æ®åå¥è®¾å¤ä¿¡æ¯è¡¨
        ea_write_to_SQL(list1,con)   #å°åè¡¨åå¥è®¾å¤è¡¨ä¸ ã             ç¬¬ä¸ä¸ªåæ°ï¼è®¾å¤ç¼å·ï¼åºéºåï¼ä¾åºåç¸çæ¶ï¼åä¸ºéå¤ï¼å»é¤



#å°åå§æ°æ®è½¬åææ°çåè¡¨ï¼ååå¥è®¾å¤ä¿¡æ¯è®¾å¤ä¿¡æ¯è¡¨ä¸  /åå¥
def ea_t_dev(list,con):  #æå®¶åºéºçå¶å®é¡µçæ°æ®è®°å½ ï¼liståè¡¨åç´ ä¾ç¶ä¸ºåè¡¨ï¼æ¯å¦[[1,2,3,'a'],[52,3,'a'],[6,2,3,'a']] ï¼conä¸ºæ°æ®åºçå»ºç«   
    staging=[]    #è¡¨ç¤ºè½¬æ¢åçåè¡¨
    for item in list:
        #æåéè¦çå¼ï¼å¹¶æ·»å å¶ä»åæ®µ
        staging.append(refind_ea(item))   #è½¬å
    print('è®¾å¤æ°æ®è½¬ååï¼')
    for i in staging:
        print(i) 

    #æ¥è¯¢è®¾å¤è¡¨å·²åçæ°æ®ï¼è¥å·²åå¨è®¾å¤ä¿¡æ¯ï¼åä¸åå¥
    dev_info_data_if_exisitd(staging,con)
    

#----------------------------------åå¥åéæ°æ®è¡¨

#è¿åéç»åçåè¡¨
def refind_fd(list):  #ä¸æ¡è®°å½ï¼ä¹å°±æ¯ä¸ä¸ªåè¡¨
    temp=[]
    temp.append(list[2])  #è®¾å¤ç¼å·
    temp.append(list[12]) #ä¸æ¥æ¶é´
    temp.append(list[11])  #å½å±æ¶é´
    temp.append(list[6])   #é£æºçµæµ 6
    temp.append(list[7])   #ååå¨çµæµ 7
    temp.append(list[4])   #è¿æ²¹çæµåº¦å¼
    temp.append(list[5])   #ææ²¹çæµåº¦å¼

    print(temp)
    return temp


#å°åè¡¨åå¥åéæ°æ®è¡¨ä¸ 
def fd_write_to_SQL(list,con): 
    data = pd.DataFrame(list,columns=['MV_Stat_Code','MV_Create_Time','MV_Data_Time','MV_Fan_Electricity','MV_Purifier_Electricity','MV_Fume_Concentration','MV_Fume_Concentration2'])
    print("åå¥åæ°æ°æ®è¡¨,DateFrameä¸ºï¼")
    print(data)

    # test3 è¦åå¥çæ°æ®è¡¨ï¼è¿æ ·åçè¯è¦æåå¨æ°æ®åºå»ºå¥½è¡¨
    data.to_sql(name="fd_t_minutevalue", con=con, if_exists="append",index=False,index_label=False)

    print("åéæ°æ®è¡¨åå¥å®æ!")
    
#è½¬å ååå¥fd_t_minbuteè¡¨ä¸ 
def fd_t_minbute(list,con):  #ä¸é¡µçæ°æ®è®°å½ ï¼conä¸ºæ°æ®åºçå»ºç«
    staging=[]    #ä¿åè½¬æ¢åçåè¡¨
    for item in list:
        #æåéè¦çå¼ï¼å¹¶æ·»å å¶ä»åæ®µ
        staging.append(refind_fd(item))  
    print('åéæ°æ®è½¬ååï¼')
    for i in staging:
        print(i) 
    fd_write_to_SQL(staging,con)   #å°åè¡¨åå¥ea_t_decè¡¨ä¸


#--------------------------------------------------------------------------------------------------------------é£å¶å®¶
def get_OnePage_teshu_shiqijia(url,count):
    global ck
    global list_temp    #ä½¿ç¨å¨å±åé
    

    list_temp.clear()  #æ¸ç©ºä¸´æ¶è¡¨
    headers = {
        # æ¤å¤æ³¨æcookieï¼è¦èªå·±æå
        "Cookie":ck,
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36",
    }
    r = requests.get(url=url, headers=headers, verify=False).text
    soup = bs(r,'html.parser')

    list=[]                     #åå»ºåè¡¨æ¥ä¿åç»æ
   
    tags = soup.find_all("tr")  # åè¡¨ææè¡
    for tag in tags:  # æ¯ä¸ªtagæ¯ä¸è¡
        count=count+1
        element = tag.text  # è·å<tr>æ ç¾åææææ¬ä¿¡æ¯
        element = element.strip()  # å°åç¬¦ä¸²é¦å°¾ç©ºæ ¼å»é¤
        list1 = element.split();  # ä»¥ç©ºæ ¼ä¸ºåéå°åç¬¦ä¸²åä¸ºåè¡¨

        del (list1[-2:])            #åè¡¨æåä¸¤ä¸ªåç´ ä¸éè¦,å é¤
        print('å é¤ç¹æ®çåä¸¤ä¸ª')
        print(list1)

        str_temp1=list1[4]+list1[5]  #ç¬¬5,6åå¹¶ä¸¤ä¸ªåç´ ä¸ºä¸ä¸ª
        print(str_temp1)
        del list1[5]
        list1[4]=str_temp1
        print("åç´ åå¹¶å®æ")
        print(list1)

        str_temp2=list1[1]+list1[2]    #ç¬¬äºä¸åç´ åå¹¶å®æ
        del list1[2]
        list1[1]=str_temp2
        
        list.append(list1) 
        print("æç»è¡æ°æ®")
        print(list1)
        #list1.clear()       

    #print(list) 
    list_data=[]  
    for i in list:                   #å·²å°å°¾æ¥ææ°æ®åå¹¶æå¹´ææ¥ æ¶åç§
        list_data.append(merge(i))
    del list_data[0]          #å é¤æåè¡¨å¤´   
    count=count-1             #å é¤äºè¡¨å¤´,æ»æ°æ®çè¡æ°åä¸
    #print(list_data)
    #list_temp=remove_Duplicates_list(list_data)[:]    #å°æææ°æ®å¤å¶ç»ä¸´æ¶åè¡¨list_temp   æ¯å»é¤éå¤åçåè¡¨
    list_temp=list_data[:]
    return count


def get_MorePages_teshu_shiqijia(url,page_num):
    global sleeptime
    global already_spider_datanum
    urls=list_url(url,page_num)   #å¾å°éè¦éåçé¡µçurl
    count_all=0          #ä¿åæ°æ®çæ»è¡æ°
    list_all=[]          #ä¿åç¬åçææçæ°æ®
    page=1
    for i in urls:
        count=0
        count_all=count_all+get_OnePage_teshu_shiqijia(i,count)
        if len(list_temp)==0:        #å¦æè¯¥é¡µä¸ºç©ºï¼åè¡¨ç¤ºè¯¥é¡µåé¢é½æ æ°æ®  éåºå¾ªç¯
            print('åé¢é¡µæ°ä¸ºç©ºï¼ç¬å»ä¸ä¸ä¸ªåºéº')
            break  
        list_all.extend(list_temp)   #å°åè¡¨è¿½å å°list_allä¸
        print("ç¬åäºç¬¬",page,"é¡µ")
        page=page+1
        print("\n")
        time.sleep(sleeptime)         #é´é2ç§è¯·æ±ä¸æ¬¡

    for j in list_all:
        print(j)              #æå°åè¡¨ä¸æ¯ä¸è¡
    print("æ»è¡æ°ä¸º:",count_all)
    already_spider_datanum += count_all #å·²ç¬åæ°æ®çæ»å
    return list_all



#-------------------------------------------------------------------------------------------------------------ç¹æ®çurl
def get_OnePage_teshu(url,count):     #æåä¸é¡µçæ°æ®,æ¾å¥list_dataä¸.urlsä¸ºè¦è®¿é®çç½é¡µå°å
    global ck
    global list_temp    #ä½¿ç¨å¨å±åé

    list_temp.clear()  #æ¸ç©ºä¸´æ¶è¡¨
    headers = {
        # æ¤å¤æ³¨æcookieï¼è¦èªå·±æå
        "Cookie":ck,
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36",
    }
    r = requests.get(url=url, headers=headers, verify=False).text
    soup = bs(r,'html.parser')

    list=[]                     #åå»ºåè¡¨æ¥ä¿åç»æ
   
    tags = soup.find_all("tr")  # åè¡¨ææè¡
    for tag in tags:  # æ¯ä¸ªtagæ¯ä¸è¡
        count=count+1
        element = tag.text  # è·å<tr>æ ç¾åææææ¬ä¿¡æ¯
        element = element.strip()  # å°åç¬¦ä¸²é¦å°¾ç©ºæ ¼å»é¤
        list1 = element.split();  # ä»¥ç©ºæ ¼ä¸ºåéå°åç¬¦ä¸²åä¸ºåè¡¨

        del (list1[-2:])            #åè¡¨æåä¸¤ä¸ªåç´ ä¸éè¦,å é¤
        print('å é¤ç¹æ®çåä¸¤ä¸ª')
        print(list1)
        list.append(list1) 
        #list1.clear()       

    #print(list) 
    list_data=[]  
    for i in list:                   
        list_data.append(merge(i))   #å°å°¾æ¥ææ°æ®åå¹¶æå¹´ææ¥ æ¶åç§
    del list_data[0]          #å é¤æåè¡¨å¤´   
    count=count-1             #å é¤äºè¡¨å¤´,æ»æ°æ®çè¡æ°åä¸
    #print(list_data)
    #list_temp=remove_Duplicates_list(list_data)[:]    #å°æææ°æ®å¤å¶ç»ä¸´æ¶åè¡¨list_temp   æ¯å»é¤éå¤åçåè¡¨
    list_temp=list_data[:]
    return count


def get_MorePages_teshu(url,page_num):   #ç¬åæå®åºéºåçå¤é¡µæ°æ®,pge_numè¡¨ç¤ºç¬åçé¡µæ°
    global sleeptime
    global already_spider_datanum
    urls=list_url(url,page_num)   #å¾å°éè¦éåçé¡µçurl  è¿åè¯¥urlå¯¹åºé¡µçææé¾æ¥å½¢å¼ï¼è¿åå¼ä¸ºåè¡¨
    count_all=0          #ä¿åæ°æ®çæ»è¡æ°
    list_all=[]          #ä¿åç¬åçææçæ°æ®
    page=1
    for i in urls:
        count=0
        count_all=count_all+get_OnePage_teshu(i,count)
        if len(list_temp)==0:        #å¦æè¯¥é¡µä¸ºç©ºï¼åè¡¨ç¤ºè¯¥é¡µåé¢é½æ æ°æ®  éåºå¾ªç¯
            print('åé¢é¡µæ°ä¸ºç©ºï¼ç¬å»ä¸ä¸ä¸ªåºéº')
            break  
        list_all.extend(list_temp)   #å°åè¡¨è¿½å å°list_allä¸
        print("ç¬åäºç¬¬",page,"é¡µ")
        page=page+1
        print("\n")
        time.sleep(sleeptime)         #é´é2ç§è¯·æ±ä¸æ¬¡

    for j in list_all:
        print(j)              #æå°åè¡¨ä¸æ¯ä¸è¡
    print("æ»è¡æ°ä¸º:",count_all)
    already_spider_datanum += count_all #å·²ç¬åæ°æ®çæ»å
    return list_all


def spilt_url_teshu(con,page,date_begin=month_begin,date_end=now_date):        #åå¯¹ç¹æ®çurlåå¤ç,åè¿æ»¤
    global already_spider_shopnum
    urls=url_more()   #è¿åæä»¶ä¸ææåºéºçurl,å¸¦æå¤§æ¾ç¤ºæ¡æ°100 ãurlsæ¯åè¡¨
    #print(urls)
    teshu_url=[]
    #'shop=%25E9%25A3%259F%25E5%2585%25B6%25E5%25AE%25B6'  é£å¶å®¶
    special_url=['shop=%25E4%25BA%25BA%25E7%2594%259F%25E4%25B8%2580%25E4%25B8%25B2','shop=%25E7%25BC%2598%25E5%25AE%25B6','shop=%25E4%25B8%25B0%25E8%258C%2582%25E7%2583%25A4%25E4%25B8%25B2','shop=%25E6%25B3%25B0%25E7%2585%258C%25E9%25B8%25A1','shop=%25E5%25B0%258F%25E9%2593%2581%25E5%2590%259B']

    for url in urls:          #éåææåºéºçurl
        begin=url.find('&')+1
        end=url.rfind('&')
        #print(begin,end)
        #æ¾å°ç¹æ®çurl,è¿è¡ç¹æ®å¤ç
        if url[begin:end] in special_url:   
            print('åç°ç¹æ®çï¼')
            already_spider_shopnum += 1   #ç¬å»çåºéºæ°éå 1
            teshu_url.append(url)
            #åå é¤ä¸ä¸ªåè¡¨åç´ 
            url_teshu=url_add_time(url,date_begin,date_end)  #ç»ææurlå ä¸æ¥æ
            list_to_MySql=get_MorePages_teshu(url_teshu,page)    #åºéºçurl,ç¬åçé¡µæ°
            # a=remove_Duplicates_list(list_to_MySql)
            # print('\n')
            # for item in a:
            #     print(item)
            if len(list_to_MySql) == 0 :
                print('è¯¥å®¶åºéºæ¶é´æ®µæ æ°æ®ï¼å·²è·³è¿')
                continue
            has_remove_duplicates = remove_Duplicates_list(list_to_MySql)   #å»é¤æä¸ªåºéºæå®é¡µæ°ææéå¤çæ°æ®
            is_minutes_exceed_30(has_remove_duplicates,con)      # å°æå®é¡µæ°çè®¾å¤æéæ°æ®åå¥æ°æ®åºå¼å¸¸è¡¨ä¸
            isExceeding(has_remove_duplicates,con)               # å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºè¶æ è¡¨ä¸
            ea_t_dev(has_remove_duplicates,con)                  # å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºè®¾å¤ä¿¡æ¯è¡¨ä¸
            fd_t_minbute(has_remove_duplicates,con)              #å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºåéæ°æ®è¡¨ä¸ 

            list_to_MySql.clear()
        if url[begin:end]=='shop=%25E9%25A3%259F%25E5%2585%25B6%25E5%25AE%25B6':   #é£å¶å®¶
            print('åç°ç¹æ®çï¼')
            already_spider_shopnum += 1   #ç¬å»çåºéºæ°éå 1
            teshu_url.append(url)
            #åå é¤ä¸ä¸ªåè¡¨åç´ 
            url_teshu=url_add_time(url,date_begin,date_end)  #ç»ææurlå ä¸æ¥æ
            list_to_MySql=get_MorePages_teshu_shiqijia(url_teshu,page)    #åºéºçurl,ç¬åçé¡µæ°
            # b=remove_Duplicates_list(list_to_MySql)
            # for item in b:
            #     print(item)
            if len(list_to_MySql) == 0 :
                print('è¯¥å®¶åºéºæ¶é´æ®µæ æ°æ®ï¼å·²è·³è¿')
                continue
            has_remove_duplicates = remove_Duplicates_list(list_to_MySql)   #å»é¤æä¸ªåºéºæå®é¡µæ°ææéå¤çæ°æ®
            is_minutes_exceed_30(has_remove_duplicates,con)      # å°æå®é¡µæ°çè®¾å¤æéæ°æ®åå¥æ°æ®åºå¼å¸¸è¡¨ä¸
            isExceeding(has_remove_duplicates,con)               # å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºè¶æ è¡¨ä¸
            ea_t_dev(has_remove_duplicates,con)                  # å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºè®¾å¤ä¿¡æ¯è¡¨ä¸
            fd_t_minbute(has_remove_duplicates,con)              #å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºåéæ°æ®è¡¨ä¸ 
      
            list_to_MySql.clear()
    for t in teshu_url:     #ä»urlsè¡¨ä¸å é¤ç¹æ®ç
        urls.remove(t)
    print(len(urls))
    return urls

#-------------------------------------------------------------------------------------------------------------


def spider_all(con,page,date_begin=month_begin,date_end=now_date):    #ç¬åæä»¶ä¸ææåºéº(åæ¬ç¹æ®çurlåºéº)    æ°æ®åºè¿æ¥å¯¹è±¡ ,è¦ç¬åçé¡µæ°,å¼å§æ¶é´,ç»ææ¶é´
    global already_spider_shopnum 
    url_all=[]
    #urls=url_more()   #è¿åæä»¶ä¸ææåºéºçurl,å¸¦æå¤§æ¾ç¤ºæ¡æ°100   
    #åä¸ç¬¦åçåå¤ç
    urls=spilt_url_teshu(con,page,date_begin,date_end)

    for url in urls:  #ç»ææurlå ä¸æ¥æ
        url_all.append(url_add_time(url,date_begin,date_end))
  
    for i in url_all:   #æå°æç»çurl
        print(i)

    for j in url_all:     #æ ¹æ®ææurlåå¥æ°æ®åº     
        list_to_MySql=get_MorePages(j,page)    #åºéºçurl,ç¬åçé¡µæ°
        already_spider_shopnum += 1   #ç¬å»çåºéºæ°éå 1
        # a=remove_Duplicates_list(list_to_MySql)
        # print('\n\n')
        # for item in a:
        #     print(item)
        if len(list_to_MySql) == 0 :
            print('è¯¥å®¶åºéºæ¶é´æ®µæ æ°æ®ï¼å·²è·³è¿')
            continue
        has_remove_duplicates = remove_Duplicates_list(list_to_MySql)   #å»é¤æä¸ªåºéºæå®é¡µæ°ææéå¤çæ°æ®
        is_minutes_exceed_30(has_remove_duplicates,con)      # å°æå®é¡µæ°çè®¾å¤æéæ°æ®åå¥æ°æ®åºå¼å¸¸è¡¨ä¸
        isExceeding(has_remove_duplicates,con)               # å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºè¶æ è¡¨ä¸ åå¥å¼å¸¸è¡¨ä¸
        ea_t_dev(has_remove_duplicates,con)                  # å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºè®¾å¤ä¿¡æ¯è¡¨ä¸
        fd_t_minbute(has_remove_duplicates,con)              #å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºåéæ°æ®è¡¨ä¸ 
    
        list_to_MySql.clear()

def back_cookie():   #ä»æä»¶ä¸è¯»åcookie
    global ck
    with open("D:\\z\\workplace\\cookie.txt",'r') as fp:
        ck=fp.read()


def write_Sql(list,con):      #å°ç½ç«æ°æ®åå¥æ°æ®åº
    data = pd.DataFrame(list,columns=['provider','shop_name','equipment_number','equipment_name','smoke_push_density','smoke_pop_density','wind_turbine','purifier','level','alarm_required','alarm_triggered','attribution_time','reporting_time','data_time'])
    print("\n\n")
    print(data)
    # engine = create_engine("mysql+mysqlconnector://root:1234@localhost:3306/qianduan_sql?charset=utf8")
    # con = engine.connect()

    # test3 è¦åå¥çæ°æ®è¡¨ï¼è¿æ ·åçè¯è¦æåå¨æ°æ®åºå»ºå¥½è¡¨
    data.to_sql(name="ed_data", con=con, if_exists="append",index=False,index_label=False)
    # con.close()
    print("åå¥å®æ!")

ck=""     #ä¿åcookie
shopnum=0   #æä»¶ä¸åºéºæ»æ°
already_spider_shopnum=0   #å·²ç¬å»çåºéºæ°é
already_spider_datanum=0   #å·²ç¬å»çæ°æ®æ¡æ°
sleeptime=4

Key_period_noon_begin = datetime.strptime('10:00',"%H:%M")    #ä¸åéç¹æ¶æ®µ
Key_period_noon_end = datetime.strptime('14:00',"%H:%M")


Key_period_night_begin = datetime.strptime('17:00',"%H:%M")   #æä¸éç¹æ¶æ®µ
Key_period_night_end = datetime.strptime('21:00',"%H:%M")

def pass_login():
    global con_read
    #"mysql+mysqlconnector://root:1234@localhost:3306/qianduan_sql?charset=utf8"
    #engine = create_engine("mysql+mysqlconnector://root:1234@localhost:3306/qianduan_sql?charset=utf8")
    engine = create_engine("mysql+mysqlconnector://root:1234@localhost:3306/qianduan_sql?charset=utf8")
    con = engine.connect()

    back_cookie()   # ä»æä»¶ä¸è¯»åcookie

    #ç¬åææåºéº  å¹¶è®¡ç®èæ¶
    start_time=time.time()

    spider_all(con,55,'2023-06-01','2023-06-30')  #ç¬åæä»¶ä¸ææçåºéºå

    end_time=time.time()
    # å³éæ°æ®åºè¿æ¥
    con_read.close()
    con.close()
    print("åå¥å®æ!")
    print("è®¾ç½®ç¬åçæ¶é´é´éä¸º",sleeptime,"ç§")
    print("å±æ",shopnum,"å®¶","å·²ç¬å",already_spider_shopnum,"å®¶")
    print("å±ç¬å",already_spider_datanum,"æ¡è®°å½")
    print("å±èæ¶:{:.2f}ç§".format(end_time-start_time))

engine = create_engine("mysql+mysqlconnector://root:1234@localhost:3306/qianduan_sql?charset=utf8")
# ä¸é¨è¯»åè®¾å¤ä¿¡æ¯è¡¨
con_read = engine.connect()
pass_login()

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,66 @@
			def remove_duplicates_dev_info (origin_data) :
			"""å¯¹åå¥è®¾å¤ä¿¡æ¯è¡¨çæ°æ®å»é

			Args:
			origin_data (list): ç¬åçåå§æ°æ®

			Returns:
			list: å·²å»é¤éå¤çæ°æ®
			"""
			has_removed_dup_dev_info=[]
			for item in origin_data :
			if item[1:4] not in ( [x[1:4] for x in has_removed_dup_dev_info] ) :
			has_removed_dup_dev_info.append(item)
			return has_removed_dup_dev_info










			def remove_given_data_dev_info (wait_for_remove_list, sub_data ) :
			"""wait_for_remove_listçåç´ [1:4]ä¸åå«sub_data,åå é¤è¯¥åç´

			Args:
			wait_for_remove_list (list): åå§åè¡¨,åç´ ä¾ç¶ä¸ºlistç±»å
			sub_data (list): æå®ååè¡¨

			Returns:
			temp: å é¤åçæ°æ®
			"""

			temp = []
			for item in wait_for_remove_list :
			if item[1:4] != sub_data :
			temp.append(item)
			return temp









			# list_test1=['32','è¡¡æºè¿ç§æï¼æ·±å³ï¼æéå¬å¸', 'é¦¨è¿ç¾é£å°éï¼åå°¼ç¾é£å¹¿åºï¼','hengzhiyuan_64480047078091','']
			# list_test2=['f','è¡¡æºè¿ç§æï¼æ·±å³ï¼æéå¬å¸', 'é¦¨è¿ç¾é£å°éï¼åå°¼ç¾é£å¹¿åºï¼','hengzhiyuan_64480047078091','']
			# list_test3=['gf','è¡¡æºè¿ç§æï¼æ·±å³ï¼æéå¬å¸', 'é¦¨è¿ç¾é£å°éï¼åå°¼ç¾é£å¹¿åºï¼','hengzhiyuan_64480047078091','']
			# list_test4=['ds','è¡¡æºè¿ç§æï¼æ·±å³ï¼æéå¬å¸', 'é¦¨è¿ç¾é£å°éï¼åå°¼ç¾é£å¹¿åºï¼','hengzhiyuan_64480047078091','']
			# list_test5=['a','è¡¡æºè¿ç§æï¼æ·±å³ï¼æéå¬å¸', 'é¦¨è¿ç¾é£å°éï¼åå°¼ç¾é£å¹¿åºï¼','hengzhiyuan_64480047078091','']
			# list_test6=['df','è¡¡æºè¿ç§æï¼æ·±å³ï¼æéå¬å¸', 'é¦¨è¿ç¾é£å°éï¼åå°¼ç¾é£å¹¿åºï¼','hengzhiyuan_64480047078091','']

			# list_all=[]
			# list_all.append(list_test1)
			# list_all.append(list_test2)
			# list_all.append(list_test3)
			# list_all.append(list_test4)
			# list_all.append(list_test5)
			# list_all.append(list_test6)


			# print(remove_duplicates_dev_info(list_all))