fume-manage-python.git

1.修改了创建连接数据库引擎时的方言类型 2.修改了爬取数据的逻辑以及相关的异常分析代码

zmc

2023-12-22 d99d235123d43825f35cdc4c8cb49339d9651056

1.修改了创建连接数据库引擎时的方言类型 2.修改了爬取数据的逻辑以及相关的异常分析代码

已修改8个文件

已删除1个文件

已添加17个文件

	PackagesInfo.txt	45 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	Scripts/Vcode.jpg	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	Vcode.jpg	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	py_spider.py	30 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	src/Crawling.py	41 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	src/Crawling_1.py	920 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	src/__pycache__/Crawling.cpython-38.pyc	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	src/__pycache__/Crawling_1.cpython-38.pyc	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	src/__pycache__/write_to_MySql.cpython-38.pyc	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	src/__pycache__/write_to_minute_table.cpython-38.pyc	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	src/write_to_MySql.py	11 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	src/write_to_minute_table.py	2 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	test_get_data/__init__.py	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	test_get_data/__pycache__/__init__.cpython-38.pyc	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	test_get_data/__pycache__/__init__.cpython-39.pyc	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	test_get_data/__pycache__/login.cpython-38.pyc	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	test_get_data/__pycache__/login.cpython-39.pyc	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	test_get_data/__pycache__/request.cpython-38.pyc	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	test_get_data/__pycache__/request.cpython-39.pyc	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	test_get_data/__pycache__/url_help.cpython-38.pyc	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	test_get_data/__pycache__/url_help.cpython-39.pyc	补丁 \| 查看 \| 原始文档 \| blame \| 历史
	test_get_data/database_connect.py	86 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	test_get_data/get_data.py	92 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	test_get_data/login.py	64 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	test_get_data/request.py	37 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	test_get_data/url_help.py	36 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史

 PackagesInfo.txt

ÎÄ¼þÒÑÉ¾³ý

 Scripts/Vcode.jpg


 Vcode.jpg



 py_spider.py

@@ -2,10 +2,9 @@
from flask_cors import CORS

import sys
# sys.path.append('D:\\z\workplace\\VsCode\\pyvenv\\venv')
sys.path.append('../')

import src.Crawling as Crawling
import src.Crawling_1 as Crawling
import src.auto_login as login
import pandas as pd
from sqlalchemy import create_engine
@@ -22,19 +21,17 @@

session = -1


# æ¨¡æç»éå¹¶ç¬åæ°æ®
@app.route('/getData',methods=['POST'])
def get_data():
    if request.method == 'POST':
        data=request.get_json()
        if(session != -1) :
            # if(len(session.cookies.get_dict()) == 0):
            #     # sessionå¤±æ
            #     return '-2'

            result,all_data=Crawling.pass_login(session,data.get('beginTime'),data.get('endTime'),data.get('selectedShopNames'))
            print('\n\nç¬åçææçallData\n',all_data)
            duplicate_data,new_data=is_duplicate(all_data)
            # if(len(duplicate_data)==0):
            #     duplicate_data.append('æ éå¤æ°æ®')
            print('éå¤çæ°æ®ä¸ºï¼',duplicate_data)
            jso ={
                # åé¦ä¿¡æ¯
@@ -51,24 +48,22 @@
            return '-1'
    return jsonify(jso)

# åå¥æ°æ®åº åå¥4å¼ è¡¨ä¸
# å¯¹æ°æ®è¿è¡å¼å¸¸åæï¼å°ç»æåå¥å¼å¸¸è¡¨ï¼è®¾å¤ä¿¡æ¯è¡¨ï¼åéæ°æ®è¡¨
@app.route('/store',methods=['POST'])
def write_new():
    if request.method =='POST':
        data = request.get_json()
        # print('dataä¸ºï¼',data.get('allData'))
        # print('è¦åå¥çæ°æ®æ¡æ°ä¸ºï¼',len(data.get('allData')))

        # åå¥æ°æ®åº
        w_t_MySql.write(data.get('allData'))
        return 'åå¥å®æï¼'

# åå¥æ°æ®åº åªåå¥åéæ°æ®è¡¨

# åªåå¥åéæ°æ®è¡¨
@app.route('/minute',methods=['POST'])
def write_dup():
    if request.method =='POST':
        data = request.get_json()
        # print('dataä¸ºï¼',data.get('allData'))
        # print('è¦åå¥çæ°æ®æ¡æ°ä¸ºï¼',len(data.get('allData')))
        # åå¥æ°æ®åº
        w_t_minute.write(data.get('allData'))
        return 'åå¥å®æï¼'
@@ -88,25 +83,18 @@
# lstä¸ºè¦åæ°æ®åºå·²åçæ°æ®è¿è¡æ¯è¾ï¼lståç´ åªéè¦3ä¸ªåæ®µã è¿åå¼æ¯éå¤çæ°æ®
def is_duplicate(lst):
    temp=copy.deepcopy(lst)
    # print('temp',temp)
    # print('\n')
    # åªä¿å3ä¸ªåæ®µ
    after_address=[]
    for item in temp:
        # print('item',item)
        # print('\n')
        a=[]
        # åºéºååè®¾å¤ç¼å·
        a.append(item[1])
        # print('item1',item[1])
        # print('\n')

        a.append(item[2])
        # å½å±æ¶é´
        time=str(item[11])+':00'
        a.append(time)
        # print('a',a)
        # print('\n')

        after_address.append(a)

    engine = create_engine("mysql+pymysql://fumeRemote:feiyu2023@114.215.109.124:3306/fume?charset=utf8")

 src/Crawling.py

@@ -120,7 +120,8 @@
        count_all=count_all+get_OnePage(i,count)
        if len(list_temp)==0:        #å¦æè¯¥é¡µä¸ºç©ºï¼åè¡¨ç¤ºè¯¥é¡µåé¢é½æ æ°æ®  éåºå¾ªç¯
            print('åé¢é¡µæ°ä¸ºç©ºï¼ç¬å»ä¸ä¸ä¸ªåºéº')
            break                    #éåºå¾ªç¯
            break 
                           #éåºå¾ªç¯
        list_all.extend(list_temp)   #å°ä¸é¡µæ°æ®åè¡¨è¿½å å°list_allä¸
        print("ç¬åäºç¬¬",page,"é¡µ")
        page=page+1
@@ -604,11 +605,7 @@
    global ck
    global list_temp    #ä½¿ç¨å¨å±åé
    list_temp.clear()  #æ¸ç©ºä¸´æ¶è¡¨
    # session.headers = {
    #     # æ¤å¤æ³¨æcookieï¼è¦èªå·±æå
    #     # "Cookie":ck,
    #     "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36",
    # }

    r = session.get(url, verify=False).text
    soup = bs(r,'html.parser')

@@ -686,11 +683,7 @@
    global list_temp    #ä½¿ç¨å¨å±åé

    list_temp.clear()  #æ¸ç©ºä¸´æ¶è¡¨
    # session.headers = {
    #     # æ¤å¤æ³¨æcookieï¼è¦èªå·±æå
    #     # "Cookie":ck,
    #     "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36",
    # }

    r = session.get(url,  verify=False).text
    soup = bs(r,'html.parser')

@@ -707,7 +700,6 @@
        print('å é¤ç¹æ®çåä¸¤ä¸ª')
        print(list1)
        list.append(list1) 
        #list1.clear()       

    #print(list) 
    list_data=[]  
@@ -753,36 +745,27 @@
    urls=url_more()   #è¿åæä»¶ä¸ææåºéºçurl,å¸¦æå¤§æ¾ç¤ºæ¡æ°100 ãurlsæ¯åè¡¨
    #print(urls)
    teshu_url=[]
    #'shop=%25E9%25A3%259F%25E5%2585%25B6%25E5%25AE%25B6'  é£å¶å®¶
    special_url=['shop=%25E4%25BA%25BA%25E7%2594%259F%25E4%25B8%2580%25E4%25B8%25B2','shop=%25E7%25BC%2598%25E5%25AE%25B6','shop=%25E4%25B8%25B0%25E8%258C%2582%25E7%2583%25A4%25E4%25B8%25B2','shop=%25E6%25B3%25B0%25E7%2585%258C%25E9%25B8%25A1','shop=%25E5%25B0%258F%25E9%2593%2581%25E5%2590%259B']

    for url in urls:          #éåææåºéºçurl
        begin=url.find('&')+1
        end=url.rfind('&')
        #print(begin,end)
        #æ¾å°ç¹æ®çurl,è¿è¡ç¹æ®å¤ç
        if url[begin:end] in special_url:   
            print('åç°ç¹æ®çï¼')
            already_spider_shopnum += 1   #ç¬å»çåºéºæ°éå 1
            already_spider_shopnum += 1   # ç¬å»çåºéºæ°éå 1
            teshu_url.append(url)
            #åå é¤ä¸ä¸ªåè¡¨åç´ 
            url_teshu=url_add_time(url,date_begin,date_end)  #ç»ææurlå ä¸æ¥æ
            list_to_MySql=get_MorePages_teshu(url_teshu,page)    #åºéºçurl,ç¬åçé¡µæ°
            # a=remove_Duplicates_list(list_to_MySql)
            # print('\n')
            # for item in a:
            #     print(item)
            url_teshu=url_add_time(url,date_begin,date_end)  # ç»ææurlå ä¸æ¥æ
            list_to_MySql=get_MorePages_teshu(url_teshu,page)    # åºéºçurl,ç¬åçé¡µæ°

            if len(list_to_MySql) == 0 :
                print('è¯¥å®¶åºéºæ¶é´æ®µæ æ°æ®ï¼å·²è·³è¿')
                continue
            has_remove_duplicates = remove_Duplicates_list(list_to_MySql)   #å»é¤æä¸ªåºéºæå®é¡µæ°ææéå¤çæ°æ®
            for item in has_remove_duplicates:
                all_data.append(item)
            # is_minutes_exceed_30(has_remove_duplicates,con)      # å°æå®é¡µæ°çè®¾å¤æéæ°æ®åå¥æ°æ®åºå¼å¸¸è¡¨ä¸
            # isExceeding(has_remove_duplicates,con)               # å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºè¶æ è¡¨ä¸
            # ea_t_dev(has_remove_duplicates,con)                  # å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºè®¾å¤ä¿¡æ¯è¡¨ä¸
            # fd_t_minbute(has_remove_duplicates,con)              #å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºåéæ°æ®è¡¨ä¸ 

         
            list_to_MySql.clear()
        if url[begin:end]=='shop=%25E9%25A3%259F%25E5%2585%25B6%25E5%25AE%25B6':   #é£å¶å®¶
            print('åç°ç¹æ®çï¼')
@@ -800,11 +783,7 @@
            has_remove_duplicates = remove_Duplicates_list(list_to_MySql)   #å»é¤æä¸ªåºéºæå®é¡µæ°ææéå¤çæ°æ®
            for item in has_remove_duplicates:
                all_data.append(item)
            # is_minutes_exceed_30(has_remove_duplicates,con)      # å°æå®é¡µæ°çè®¾å¤æéæ°æ®åå¥æ°æ®åºå¼å¸¸è¡¨ä¸
            # isExceeding(has_remove_duplicates,con)               # å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºè¶æ è¡¨ä¸
            # ea_t_dev(has_remove_duplicates,con)                  # å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºè®¾å¤ä¿¡æ¯è¡¨ä¸
            # fd_t_minbute(has_remove_duplicates,con)              #å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºåéæ°æ®è¡¨ä¸ 
      
           
            list_to_MySql.clear()
    for t in teshu_url:     #ä»urlsè¡¨ä¸å é¤ç¹æ®ç
        urls.remove(t)

 src/Crawling_1.py

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,920 @@
#sum å¤é¡µ å¥åºæå ç¬åæä»¶ä¸ææçåºéº  ç½é¡µå®æ´è¡¨ç«¯ å»é¤éå¤æ°æ® éå°ç©ºé¡µé¢ä¼è·³å°ä¸ä¸å®¶åºéº ãéå°æå®¶åºéºæ æ°æ®ï¼è·³è¿å»ä¸ä¸å®¶
#ç¬å»æå®¶åºéºæå®çé¡µæ°ï¼ä¸é¡µè®°å½æ°é»è®¤å¤§å°ä¸º100æ¡ï¼ï¼æ¯å¦ç¬å12é¡µï¼åç¬å12é¡µåå°ç»æä¸æ¬¡æ§åå¥æ°æ®åº
#ç¬å»æ´ä¸ªé¡µé¢è¡¨ç»æï¼ååå«åå¥4å¼ è¡¨ä¸ï¼ç¬åçæ°æ®åå¥ä¸¤å¼ è¡¨ä¸ï¼è¿æè¶æ è¡¨ å¼å¸¸è¡¨ï¼
#ç½é¡µä¸åæ®µå±14ä¸ªï¼åå¥æ°æ®åºæ¯15ä¸ªï¼åºå·+14ï¼
import requests
from bs4 import BeautifulSoup as bs  
import re              #æ£åè¡¨è¾¾å¼
from pymysql import *  # è¿æ¥mysqlæ°æ®åº
import pandas as pd
from sqlalchemy import create_engine
import urllib.parse                   #urlåéç¼ç 
import time
import uuid
from datetime import datetime, timedelta

import sys
sys.path.append('../../')
import src.core_modules.remove_duplicates_methods as rdm



now_date = time.strftime("%Y-%m-%d", time.localtime())    #è·åå½åå¹´ææ¥  #urlç¼ç å¹´ææ¥å¼å§é»è®¤æ¶é´
now_date1 = time.strftime("%Y-%m", time.localtime())  
month_begin=now_date1+'-01'                 #è®¾ç½®å½åæä»½çå¼å§

list_temp=[]  #ä¸´æ¶åè¡¨  å¨å±åé



def remove_Duplicates_list(list):        #åè¡¨èªèº«å»é
    global already_spider_datanum
    list_store=[]
    for item in list:
        if item not in list_store:
            list_store.append(item)
        else:
            print("åç°éå¤")
            already_spider_datanum=already_spider_datanum-1
    #print(list_store)
    return list_store

def merge(list):  #åå¹¶liståæ°åä¸ªåç´  
    date_1=str(list.pop(-1))  #å é¤å°¾åç´ åè¿è½ç»§ç»ä½¿ç¨æ¹åç´ ï¼
    date_2=str(list.pop(-1))
    date1=date_2+' '+date_1       #åå¹¶ä¸ºå¹´ææ¥æ¶åç§

    date_3=str(list.pop(-1))  
    date_4=str(list.pop(-1))
    date2=date_4+' '+date_3

    date_5=str(list.pop(-1))
    date_6=str(list.pop(-1))
    date3=date_6+' '+date_5
    list.append(date3)    #å°åå¹¶çæ°æ®åä¼liståè¡¨ç»å°¾.
    list.append(date2)      
    list.append(date1)
    
    
    return list

def list_url(url,page_num):  #urlä¸çiæ¯é¡µ ,apge_numè¡¨ç¤ºç¬åçé¡µæ°  ãurlåé¢å ä¸é¡µçåæ°
    urls = [url+'&page'+'={}'.format(str(i)) for i in range(1,page_num+1)]
    return urls    # è¿åè¯¥urlå¯¹åºé¡µçææé¾æ¥å½¢å¼ï¼è¿åå¼ä¸ºåè¡¨


def get_OnePage(url,count):     #æåä¸é¡µçæ°æ®,æ¾å¥list_dataä¸.urlsä¸ºè¦è®¿é®çç½é¡µå°å
    global list_temp    #ä½¿ç¨å¨å±åé

    list_temp.clear()  #æ¸ç©ºä¸´æ¶è¡¨
    r = session.get(url, verify=False).text
    soup = bs(r,'html.parser')

    # æ¾å°ææçtræ ç¾
    rows = soup.find_all('tr')

    # æåè¡¨æ ¼ä¸çæ°æ®
    result = []  #åå»ºåè¡¨æ¥ä¿åç»æ
    for row in rows:
        # æ°æ®æ¡æ°å 1
        count=count+1
        # ä¿åè¡¨æ ¼çè¡æ°æ®
        data = []
        # å¾å°è¯¥è¡çææåæ°æ®
        cols = row.find_all('td')
        # å¾ªç¯æ¯ä¸å
        for col in cols:
            if col.find('div'):
                # å¦ætdä¸åå«divï¼ååç¬æåå¶åå®¹
                div_content = col.find('div').text.strip()
                # è¿ååç´ çææ¬åå®¹ æç´¢tagçç´æ¥åèç¹
                td_content = ''.join(col.find_all(text=True, recursive=False)).strip()
                data.append(td_content)
                data.append(div_content)
            else:
                # å¦ætdä¸ä¸åå«divï¼åç´æ¥æåtdçåå®¹
                td_content = col.text.strip()
                data.append(td_content)
        # å é¤'æä½'ï¼'è¯¦æ'
        del (data[-2:])
        # å é¤å°å
        del (data[2])
        result.append(data)
    print('ä¸é¡µçç»æä¸ºï¼',result)
    # å é¤è¡¨å¤´çæ é¢è¡
    del (result[0])
    
    count=count-1             #å é¤äºè¡¨å¤´,æ»æ°æ®çè¡æ°åä¸

    list_temp=result[:]

    print('-'*10)
    print('è·åå°çæ°æ®å¹¶ä¸å¤çåä¸ºï¼')
    print(list_temp)
    print('-'*10)

    # è¿åè·åå°æ°æ®çæ¡æ°
    return count



def get_MorePages(url,page_num):   #ç¬åæå®åºéºåçå¤é¡µæ°æ®,apge_numè¡¨ç¤ºç¬åçé¡µæ°
    global sleeptime
    global already_spider_datanum
    urls=list_url(url,page_num)   #å¾å°éè¦éåçé¡µçurl
    count_all=0          #ä¿åæ°æ®çæ»è¡æ°
    list_all=[]          #ä¿åç¬åçææçæ°æ®
    page=1
    for i in urls:
        count=0
        count_all=count_all+get_OnePage(i,count)
        if len(list_temp)==0:        #å¦æè¯¥é¡µä¸ºç©ºï¼åè¡¨ç¤ºè¯¥é¡µåé¢é½æ æ°æ®  éåºå¾ªç¯
            print('åé¢é¡µæ°ä¸ºç©ºï¼ç¬å»ä¸ä¸ä¸ªåºéº')
            break 
                           #éåºå¾ªç¯
        list_all.extend(list_temp)   #å°ä¸é¡µæ°æ®åè¡¨è¿½å å°list_allä¸
        print("ç¬åäºç¬¬",page,"é¡µ")
        page=page+1
        print("\n")
        time.sleep(sleeptime)         #é´é2ç§è¯·æ±ä¸æ¬¡

    for j in list_all:
        print(j)              #æå°åè¡¨ä¸æ¯ä¸è¡
    print("æ»è¡æ°ä¸º:",count_all)
    already_spider_datanum += count_all #å·²ç¬åæ°æ®çæ»å

    return list_all    


def url_more(): #è¿åæä»¶ä¸éºåç¼ç å½¢æurl,è¿åå¼æ¯urlåè¡¨     é»è®¤æ¥çç½é¡µçæå¤§æ¾ç¤ºæ¡æ°100
    global shopnum
    global webshops
    shopnames = webshops[:]  #ä¿åä¸æåºéºåç§°
    print('url_more:',shopnames)
    #ç¼ç 
    shopnum=len(shopnames)   #æä»¶ä¸åºéºæ»æ°
    shopname_encoding=[]  #ä¿åç¼ç åçåºéºåç§°
    i=0
    for name in shopnames:
        shopname_encoding.append(urllib.parse.quote(urllib.parse.quote(shopnames[i]))) #åºéºåç§°è¿è¡åéurlç¼ç 
        i=i+1
    #æ¼æ¥ç½åå½¢æå¯ç¨çurl
    urls=[]  #ä¿åæ¼æ¥åçurl
    for shop in shopname_encoding:
        url='http://xhhb.senzly.cn/sys/yyRealTimeValue_list.jsp?key1=&shop='+shop+'&pagesize=100'
        urls.append(url)
    # for i in urls:   
    #     print(i)
    return urls   #è¿åæä»¶ä¸åºéºåç§°å¯¹åºçurl

#æ ¹æ®å¼å§åç»ææ¥ææ¥æ¼æ¥url
def url_add_time(url,date_begin=month_begin,date_end=now_date):     #url,å¹´-æ-æ¥ 2023-05-03
    url_date=url+'&key5='+date_begin+'&key6='+date_end
    print(url_date)
    return url_date

#------------------------------------------------------------------------------------------------------------è¶æ æ²¹çæ°æ®åå¥å¼å¸¸è¡¨ä¸
#ä¸¤æ¶é´æ¯å¦ç¸å·®10åé  æ¯åè¿åTRUE å¦åè¿åFALSE
def is_time_difference_equals_10_mins(datestr1, datestr2):    
    date1 = datetime.strptime(datestr1, "%Y-%m-%d %H:%M")
    date2 = datetime.strptime(datestr2, "%Y-%m-%d %H:%M")
    time_diff = date2 - date1

    return time_diff == timedelta(minutes = 10) or time_diff == timedelta(minutes = -10) #timedelta() è¡¨ç¤ºä¸¤ä¸ª date å¯¹è±¡æè time å¯¹è±¡,æè datetime å¯¹è±¡ä¹é´çæ¶é´é´é


#æ¯éååéä¸æ¬¡ä¸ºæ£å¸¸ã æ¾åºè¶è¿10åéçé´æç¹
def find_break_point(list): #listä¸ºè¶æ æ°æ®çåè¡¨
    i=0
    j=1
    break_point = []     #ä¿åé´æç¹
    for item in list[1:]:  
        if(is_time_difference_equals_10_mins(list[i][2],item[2]) == False): 
            break_point.append(j) 
        i=i+1
        j=j+1
    print('é´æç¹ä¸ºï¼')
    print(break_point)

    #åå¥é´æç¹
    return break_point
    

    
#æ ¹æ®é´æç¹å°åè¡¨åå²æå ä¸ªååè¡¨ï¼ç±resultè¿å
def point_write(list,b_point):   #listä¸ºåè¡¨ãb_pointåè¡¨åç´ ä¸ºé´æç¹ï¼é´æç¹å¼ä»å°å°å¤§
    result = []
    last_index = 0
    for index in b_point:
        result.append(list[last_index:index])   #çµæ´»
        last_index=index
    result.append(list[last_index:])
    return result


#å°è®¾å¤æéä¿¡æ¯åå¥abnormal_dataå¼å¸¸è¡¨ä¸ 
def abnormal_write_to_SQL(list,con): 
    data = pd.DataFrame(list,columns=['dev_id','exception','exception_type','region','begin_time','end_time'])
    print("\n\n")
    print(data)

    # test3 è¦åå¥çæ°æ®è¡¨ï¼è¿æ ·åçè¯è¦æåå¨æ°æ®åºå»ºå¥½è¡¨
    data.to_sql(name="abnormal_data", con=con, if_exists="append",index=False,index_label=False)
    
    

def exception(list,con):   #listä¸ºè¶æ æ°æ®çåè¡¨
    break_point=find_break_point(list) #è¿åé´æç¹
    split_list=point_write(list,break_point) #æ ¹æ®é´æç¹å°åå§åè¡¨åå²æå ä¸ªååè¡¨  split_listä¸ºä¸å±æ°ç»,å½¢å¼ä¸º[[[1,2],[4,'g']],[[8,'2'],['4','g']],[[1,2],[4,'g']]]
    # print('è¶æ æ¶é´æ®µååæçååè¡¨ä¸ºï¼ï¼')
    # for i in split_list:
    #     print(i)
    print('\n')
    abnormal=[]     #éç»å¥½çå¼å¸¸è¡¨æ°æ®

    for item in split_list:    #ä»åå²çæ°ç»ä¸æåéè¦çæ¶é´ä¿¡æ¯ï¼å¹¶æ·»å æ°çä¿¡æ¯æ°æ®
        temp=[]  
        temp.append(item[0][0])  #è®¾å¤ç¼å·
        temp.append('æ°æ®å¼å¸¸')  #è®¾å¤ç¼å·
        temp.append('0')  #æ²¹çæµåº¦è¶æ 
        temp.append('å¾æ±åº')
        temp.append(item[len(item)-1][2])  #åä¸æ¡è®°å½çå½å±æ¶é´  å¼å§æ¶é´
        temp.append(item[0][2])  #å½å±æ¶é´  ç»ææ¶é´
        abnormal.append(temp)

        print(abnormal)

    print('è¶æ å¼å¸¸æ¶é´æ®µæ°æ®ä¸ºï¼')
    for j in abnormal:
        print(j)
    abnormal_write_to_SQL(abnormal,con) #åå¥å¼å¸¸è¡¨ä¸
    print("è¶æ æ²¹çæ°æ®å¼å¸¸è¡¨åå¥å®æ!")

#------------------------------------------------------------------------------------------------------------è®¾å¤æéæ°æ®åå¥å¼å¸¸è¡¨ä¸
#ä¸¤æ¶é´æ¯å¦ç¸å·®30åé  æ¯åè¿åTRUE å¦åè¿åFALSE
def is_time_difference_equals_30_mins(datestr1, datestr2):    
    date1 = datetime.strptime(datestr1, "%Y-%m-%d %H:%M")
    date2 = datetime.strptime(datestr2, "%Y-%m-%d %H:%M")
    time_diff = date2 - date1
    return time_diff > timedelta(minutes=30) 

#æ¾åºè®¾å¤æéçä¿¡æ¯ï¼å¹¶å°æ¤ä¿¡æ¯åå¥å¼å¸¸è¡¨ä¸
def is_minutes_exceed_30(list,con) :   # listä¸ºæåºéºæå®é¡µæ°çå¨é¨çè®°å½ liståç´ ä¸çæ¶é´ä¸ºååºæåï¼å³ä»å¤§å°å°
    device_failure=[]     #åå¨è®¾å¤æéçæ°æ®
    startTime = list[0][11]
    print('å¼å§æ¶é´ï¼',startTime)
    for item in list[1:] :
        if is_time_difference_equals_30_mins(item[11],startTime) :  #å¿é¡»å¤§äº30åé ä¸è½çäº30åé
            temp=[] 
            temp.append(item[2])  #è®¾å¤ç¼å·
            temp.append('è®¾å¤æé')  #è®¾å¤ç¼å·
            temp.append('1') #è®¾å¤æé
            temp.append('å¾æ±åº')
            temp.append(item[11])    #æéå¼å§æ¶é´
            startTimeSub= datetime.strptime(startTime,"%Y-%m-%d %H:%M") - timedelta(minutes = 10) #ç»æä¸ºdatetime.datetimeç±»å ï¼éè¦åè½¬ä¸ºåç¬¦ä¸²ç±»å
            print('ç¸ååç»æï¼',str(startTimeSub))
            print('ç¸ååç±»åï¼',type(str(startTimeSub)))
            temp.append(str(startTimeSub)[:16])  #æéç»ææ¶é´
            device_failure.append(temp)
        startTime = item[11]
    print('è®¾å¤æéçæ°æ®ä¸ºï¼')
    for i in device_failure :
        print(i)
    not_Key_period_exceed_30_minutes(device_failure,con)  #å°ä¾çµå¼å¸¸ä¿¡æ¯åå¥å¼å¸¸è¡¨
    #abnormal_write_to_SQL(device_failure,con)   #å°è®¾å¤æéä¿¡æ¯åå¥å¼å¸¸è¡¨
    print('ä¾çµå¼å¸¸/æçº¿ä¿¡æ¯åå¥å¼å¸¸è¡¨å®æ!')
#-----------------------------------------------------------------------------------------------------------ä¾çµå¼å¸¸æ°æ®åå¥å¼å¸¸è¡¨ä¸
#å¼å§åç»ææ¶é´é½å¤äºééç¹æ¶æ®µæ¶,è¿åtrue
def is_time_not_between_key_period(begin_time,end_time) :  #å½¢åä¸ºæ¥æåç¬¦ä¸²,å½¢å¦ '2023-06-21 14:30'
    global Key_period_noon_begin,Key_period_noon_end,Key_period_night_begin,Key_period_night_end
    # #ä¸åéç¹æ¶æ®µ
    # Key_period_noon_begin = datetime.strptime('10:00',"%H:%M")
    # Key_period_noon_end = datetime.strptime('14:00',"%H:%M")

    # #æä¸éç¹æ¶æ®µ
    # Key_period_night_begin = datetime.strptime('17:00',"%H:%M")
    # Key_period_night_end = datetime.strptime('21:00',"%H:%M")

    begin1 = datetime.strptime(begin_time[11:],"%H:%M")
    end1 = datetime.strptime(end_time[11:],"%H:%M")

    #å½å¼å§åç»ææ¶é´é½å¤äºééç¹æ¶æ®µæ¶ï¼å°è¯¥æ¡æéä¿¡æ¯åæ¶è®°å½ä¸ºï¼ çä¼¼ä¾çµå¼å¸¸
    if ((( begin1 > Key_period_noon_begin and begin1 < Key_period_noon_end ) or ( begin1 > Key_period_night_begin and begin1 < Key_period_night_end )) or (( end1 > Key_period_noon_begin and end1 < Key_period_noon_end ) or ( end1 > Key_period_night_begin and end1 < Key_period_night_end ))) ==False :
        print('å¼å§æç»ææ¶é´æ¶é´å¨ééç¹æ¶æ®µ')
        return True
    print('å¤äºéç¹æ¶æ®µ')
    return False

#å¼å§åç»ææ¶é´é½å¤äºéç¹æ¶æ®µæ¶,è¿åtrue
def is_time_between_key_period(begin_time,end_time) :  #å½¢åä¸ºæ¥æåç¬¦ä¸²,å½¢å¦ '2023-06-21 14:30'
    global Key_period_noon_begin,Key_period_noon_end,Key_period_night_begin,Key_period_night_end
    # #ä¸åéç¹æ¶æ®µ
    # Key_period_noon_begin = datetime.strptime('10:00',"%H:%M")
    # Key_period_noon_end = datetime.strptime('14:00',"%H:%M")

    # #æä¸éç¹æ¶æ®µ
    # Key_period_night_begin = datetime.strptime('17:00',"%H:%M")
    # Key_period_night_end = datetime.strptime('21:00',"%H:%M")

    begin1 = datetime.strptime(begin_time[11:],"%H:%M")
    end1 = datetime.strptime(end_time[11:],"%H:%M")

    #å½å¼å§åç»ææ¶é´é½å¤äºéç¹æ¶æ®µæ¶ï¼å°è¯¥æ¡æéä¿¡æ¯åæ¶è®°å½ä¸ºï¼ æçº¿
    if ((begin1 > Key_period_noon_begin and begin1 < Key_period_noon_end) and ( end1 > Key_period_noon_begin and end1 < Key_period_noon_end )) or ( (begin1 > Key_period_night_begin and begin1 < Key_period_night_end) and ( end1 > Key_period_night_begin and end1 < Key_period_night_end )) :
        print('å¼å§æç»ææ¶é´å¤äºéç¹æ¶æ®µ')
        return True
    print('å¤äºééç¹æ¶æ®µ')
    return False



def not_Key_period_exceed_30_minutes(list,con) :  #listä¸ºè®¾å¤æéçæ¶é´æ®µæ°æ®
    power_supply_abnormal = []  #ä¿åä¾çµå¼å¸¸ææçº¿çä¿¡æ¯
    for item in list :
        if is_time_not_between_key_period(item[4],item[5]) :   #else:
            temp = []
            temp.append(item[0])
            temp.append('è®¾å¤æé')
            temp.append('1')  #çä¼¼ä¾çµå¼å¸¸
            temp.append('å¾æ±åº')
            temp.append(item[4])
            temp.append(item[5])
            power_supply_abnormal.append(temp)
        elif is_time_between_key_period(item[4],item[5]) :
            temp = []
            temp.append(item[0])
            temp.append('è®¾å¤æé')
            temp.append('2')  #æçº¿
            temp.append('å¾æ±åº')
            temp.append(item[4])
            temp.append(item[5])
            power_supply_abnormal.append(temp)
    print('ä¾çµå¼å¸¸çæ°æ®ä¸ºï¼')
    for i in power_supply_abnormal :
        print(i)
    
    #å°ä¾çµå¼å¸¸çä¿¡æ¯åå¥æ°æ®åºå¼å¸¸è¡¨ä¸
    abnormal_write_to_SQL(power_supply_abnormal,con)   #å°è®¾å¤æéä¿¡æ¯åå¥å¼å¸¸è¡¨
    print('ä¾çµå¼å¸¸çä¿¡æ¯åå¥å¼å¸¸è¡¨å®æ!')



#------------------------------------------------------------------------------------------------------------åå¥è¶æ è¡¨ä¸

#è¿åéç»åçåè¡¨
def refind_ex(list):  #listä¸ºç½é¡µçä¸æ¡è®°å½
    temp=[]
    temp.append(list[2])  #è®¾å¤ç¼å·
    temp.append(list[12]) #ä¸æ¥æ¶é´
    temp.append(list[11])  #å½å±æ¶é´
    temp.append(list[6])   #é£æºçµæµ 6
    temp.append(list[7])   #ååå¨çµæµ7
    temp.append(list[4])   #è¿æ²¹çæµåº¦å¼
    temp.append(list[5])   #ææ²¹çæµåº¦å¼

    print(temp)
    return temp


#å°åè¡¨åå¥exceeding_st_dataè¡¨ä¸ 
def ex_write_to_SQL(list,con): 
    data = pd.DataFrame(list,columns=['MV_Stat_Code','MV_Create_Time','MV_Data_Time','MV_Fan_Electricity','MV_Purifier_Electricity','MV_Fume_Concentration','MV_Fume_Concentration2'])
    print("\n\n")
    print(data)
    #engine = create_engine("mysql+pymysql://root:1234@localhost:3306/fume?charset=utf8")
    #con = engine.connect()

    # test3 è¦åå¥çæ°æ®è¡¨ï¼è¿æ ·åçè¯è¦æåå¨æ°æ®åºå»ºå¥½è¡¨
    data.to_sql(name="exceeding_st_data", con=con, if_exists="append",index=False,index_label=False)
    #con.close()
    print("è¶æ è¡¨åå¥å®æ!")
    

# listä¸ºæåºéºæå®é¡µæ°çå¨é¨çè®°å½ å°è¶æ æ°æ®åå¥è¶æ è¡¨
def isExceeding(list,con):  #listä¸ºæåºéºæå®é¡µæ°çå¨é¨çè®°å½  liståç´ ä¸ºåè¡¨å½¢å¼
    exceedingData=[]     #ä¿åè¶æ çæ°æ®
    for item in list:       #æ¥æ¾è¶æ çæ°æ®ï¼å¹¶è®°å½ä¸
        if float(item[5]) > 1:   # æçæµåº¦å¤§äº1åè¶æ 
            print("è¯¥æ¡æ°æ®è¶æ ")
            #ä¿åè¯¥æ¡è®°å½ï¼æåéè¦çå¼ï¼å¹¶æ·»å å¶ä»åæ®µ
            exceedingData.append(refind_ex(item))
            
            
    for i in exceedingData:  #éååè¡¨
        print(i)   

    if(len(exceedingData) != 0) :  #æè¶æ æ°æ®æ¶ææ§è¡
        #å°è¶æ æ°æ®æ¶é´åç±»ååabnormal_dataå¼å¸¸è¡¨ä¸
        exception(exceedingData,con) 

        #å°è¶æ æ°æ®ç´æ¥åå¥æ°æ®åºè¶æ è¡¨ä¸  
        ex_write_to_SQL(exceedingData,con)
    else:
        print('è¯¥åºéºæ è¶æ æ°æ®')


#------------------------------------------------------------------------------------------------------------æ°æ®åå¥è®¾å¤ä¿¡æ¯è¡¨
def generate_short_uuid():
    arrayOf=[
            "a",
            "b",
            "c",
            "d",
            "e",
            "f",
            "g",
            "h",
            "i",
            "j",
            "k",
            "l",
            "m",
            "n",
            "o",
            "p",
            "q",
            "r",
            "s",
            "t",
            "u",
            "v",
            "w",
            "x",
            "y",
            "z",
            "0",
            "1",
            "2",
            "3",
            "4",
            "5",
            "6",
            "7",
            "8",
            "9",
            "A",
            "B",
            "C",
            "D",
            "E",
            "F",
            "G",
            "H",
            "I",
            "J",
            "K",
            "L",
            "M",
            "N",
            "O",
            "P",
            "Q",
            "R",
            "S",
            "T",
            "U",
            "V",
            "W",
            "X",
            "Y",
            "Z"
        ]
    list=[]
    ui=str(uuid.uuid4()).replace('-', '')
    for i in range(0,16):
        a1=ui[i*2:i*2+2]
        x=int(a1,16)
        list.append(arrayOf[x % 0x3E])
    return ''.join(list)


#è¿åéç»åçåè¡¨
def refind_ea(list):  #ä¸æ¡è®°å½ï¼ä¹å°±æ¯ä¸ä¸ªåè¡¨
    temp=[]
    temp.append(generate_short_uuid())
    temp.append(list[2])
    temp.append(list[1])
    temp.append(list[0])
    temp.append(1)
    print(temp)
    return temp

#å°åè¡¨åå¥è®¾å¤ä¿¡æ¯è®¾å¤ä¿¡æ¯ea_t_devè¡¨ä¸ 
def ea_write_to_SQL(list,con):   
    data = pd.DataFrame(list,columns=['DI_GUID','DI_Code','DI_Name','DI_Supplier','DI_Online'])
    print("\n\n")
    print('åå¥æ°æ®è¡¨ ï¼DateFrameä¸ºï¼',data)

    # test3 è¦åå¥çæ°æ®è¡¨ï¼è¿æ ·åçè¯è¦æåå¨æ°æ®åºå»ºå¥½è¡¨
    data.to_sql(name="ea_t_device_info", con=con, if_exists="append",index=False,index_label=False)
    print("è®¾å¤ä¿¡æ¯è¡¨åå¥å®æ!")


def dev_info_data_if_exisitd(list,con):  #listä¸ºç¬åæå®¶åºéºæå®é¡µæ°è½¬æ¢åçæ°æ®
    global con_read
    #åå»ºç¬¬äºä¸ªæ°æ®åºè¿æ¥
    # engine = create_engine("mysql+pymysql://root:1234@localhost:3306/fume?charset=utf8")
    # con_read = engine.connect()

    df = pd.read_sql('SELECT DI_Code,DI_Name,DI_Supplier FROM ea_t_device_info',con=con_read)   #ä»è®¾å¤ä¿¡æ¯è¡¨ä¸è¯»åè®¾å¤ç¼å·ï¼åºéºåï¼ä¾åºååæ®µçæ°æ®ãè¿åå¼æ¯DateFrameç±»å
    # con_read.close()  #å³éé¾æ¥

    res = df.values.tolist()  #DateFrameæç§è¡è½¬ælistç±»åï¼resåæ¾çæ¯è®¾å¤ä¿¡æ¯è¡¨ä¸çæ°æ®
    print('******** è®¾å¤ä¿¡æ¯******')
    for i in res:
        print(i)
    print('è®¾å¤ä¿¡æ¯è¡¨è®°å½æ¡æ°ä¸ºï¼',len(res))

    list1 = rdm.remove_duplicates_dev_info(list)  #è®¾å¤ç¼å·ï¼åºéºåï¼ä¾åºåç¸çæ¶ï¼åä¸ºéå¤ï¼å»é¤ãlist1ä¸ºå»éåç
    if len(res) > 0 :  #è®¾å¤è¡¨ä¸ææ°æ®
        #æ¯è¾
        temp=list1[:]  #å°list1æ°æ®ç»tempï¼éåtemp,è¥ç¸çï¼ä»listä¸å é¤æ°æ®ï¼é¿åä¸ä¸ªåè¡¨åæ¶éåä¸å é¤
        print('å»é¤éå¤ä¸º:')
        print(list1)
        for item in temp:
            if item[1:4] in ( x[:] for x in res ) :  #å¾åå¥æ°æ®åºçå¼ä¸è®¾å¤è¡¨ä¸æ°æ®ç¸çæ¶,å°å¾åå¥çå¼ä»listä¸ç§»é¤               
                list1=rdm.remove_given_data_dev_info(list1,item[1:4])   #è¯¥itemä»list1ä¸ç§»é¤
                   
        print('è®¾å¤ä¿¡æ¯è¡¨ä¸ææ°æ®æ¶ï¼å»éåçlistä¸ºï¼',list1)
        if( len(list1) != 0 ) :  #å é¤åä¸ä¸ºç©ºæ¶ï¼åå¥ 
            ea_write_to_SQL(list1,con)   #å°åè¡¨åå¥ea_t_devè¡¨ä¸ 
    else :      #è®¾å¤è¡¨ä¸æ æ°æ®
        # a=rdm.remove_duplicates_dev_info(list)  #è®¾å¤ç¼å·ï¼åºéºåï¼ä¾åºåç¸çæ¶ï¼åä¸ºéå¤ï¼å»é¤
        print('è®¾å¤è¡¨æ æ°æ®ï¼å¤çåå¾åå¥çè®¾å¤ä¿¡æ¯ä¸ºï¼',list1) 
        #å°å»éåæ°æ®åå¥è®¾å¤ä¿¡æ¯è¡¨
        ea_write_to_SQL(list1,con)   #å°åè¡¨åå¥è®¾å¤è¡¨ä¸ ã             ç¬¬ä¸ä¸ªåæ°ï¼è®¾å¤ç¼å·ï¼åºéºåï¼ä¾åºåç¸çæ¶ï¼åä¸ºéå¤ï¼å»é¤



#å°åå§æ°æ®è½¬åææ°çåè¡¨ï¼ååå¥è®¾å¤ä¿¡æ¯è®¾å¤ä¿¡æ¯è¡¨ä¸  /åå¥
def ea_t_dev(list,con):  #æå®¶åºéºçå¶å®é¡µçæ°æ®è®°å½ ï¼liståè¡¨åç´ ä¾ç¶ä¸ºåè¡¨ï¼æ¯å¦[[1,2,3,'a'],[52,3,'a'],[6,2,3,'a']] ï¼conä¸ºæ°æ®åºçå»ºç«   
    staging=[]    #è¡¨ç¤ºè½¬æ¢åçåè¡¨
    for item in list:
        #æåéè¦çå¼ï¼å¹¶æ·»å å¶ä»åæ®µ
        staging.append(refind_ea(item))   #è½¬å
    print('è®¾å¤æ°æ®è½¬ååï¼')
    for i in staging:
        print(i) 

    #æ¥è¯¢è®¾å¤è¡¨å·²åçæ°æ®ï¼è¥å·²åå¨è®¾å¤ä¿¡æ¯ï¼åä¸åå¥
    dev_info_data_if_exisitd(staging,con)
    

#----------------------------------åå¥åéæ°æ®è¡¨

#è¿åéç»åçåè¡¨
def refind_fd(list):  #ä¸æ¡è®°å½ï¼ä¹å°±æ¯ä¸ä¸ªåè¡¨
    temp=[]
    temp.append(list[2])  #è®¾å¤ç¼å·
    temp.append(list[12]) #ä¸æ¥æ¶é´
    temp.append(list[11])  #å½å±æ¶é´
    temp.append(list[6])   #é£æºçµæµ 6
    temp.append(list[7])   #ååå¨çµæµ 7
    temp.append(list[4])   #è¿æ²¹çæµåº¦å¼
    temp.append(list[5])   #ææ²¹çæµåº¦å¼

    print(temp)
    return temp


#å°åè¡¨åå¥åéæ°æ®è¡¨ä¸ 
def fd_write_to_SQL(list,con): 
    data = pd.DataFrame(list,columns=['MV_Stat_Code','MV_Create_Time','MV_Data_Time','MV_Fan_Electricity','MV_Purifier_Electricity','MV_Fume_Concentration','MV_Fume_Concentration2'])
    print("åå¥åæ°æ°æ®è¡¨,DateFrameä¸ºï¼")
    print(data)

    # test3 è¦åå¥çæ°æ®è¡¨ï¼è¿æ ·åçè¯è¦æåå¨æ°æ®åºå»ºå¥½è¡¨
    data.to_sql(name="fd_t_minutevalue", con=con, if_exists="append",index=False,index_label=False)

    print("åéæ°æ®è¡¨åå¥å®æ!")
    
#è½¬å ååå¥fd_t_minbuteè¡¨ä¸ 
def fd_t_minbute(list,con):  #ä¸é¡µçæ°æ®è®°å½ ï¼conä¸ºæ°æ®åºçå»ºç«
    staging=[]    #ä¿åè½¬æ¢åçåè¡¨
    for item in list:
        #æåéè¦çå¼ï¼å¹¶æ·»å å¶ä»åæ®µ
        staging.append(refind_fd(item))  
    print('åéæ°æ®è½¬ååï¼')
    for i in staging:
        print(i) 
    fd_write_to_SQL(staging,con)   #å°åè¡¨åå¥ea_t_decè¡¨ä¸


#--------------------------------------------------------------------------------------------------------------é£å¶å®¶
def get_OnePage_teshu_shiqijia(url,count):
    global ck
    global list_temp    #ä½¿ç¨å¨å±åé
    list_temp.clear()  #æ¸ç©ºä¸´æ¶è¡¨
    # session.headers = {
    #     # æ¤å¤æ³¨æcookieï¼è¦èªå·±æå
    #     # "Cookie":ck,
    #     "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36",
    # }
    r = session.get(url, verify=False).text
    soup = bs(r,'html.parser')

    list=[]                     #åå»ºåè¡¨æ¥ä¿åç»æ
   
    tags = soup.find_all("tr")  # åè¡¨ææè¡
    for tag in tags:  # æ¯ä¸ªtagæ¯ä¸è¡
        count=count+1
        element = tag.text  # è·å<tr>æ ç¾åææææ¬ä¿¡æ¯
        element = element.strip()  # å°åç¬¦ä¸²é¦å°¾ç©ºæ ¼å»é¤
        list1 = element.split();  # ä»¥ç©ºæ ¼ä¸ºåéå°åç¬¦ä¸²åä¸ºåè¡¨

        del (list1[-2:])            #åè¡¨æåä¸¤ä¸ªåç´ ä¸éè¦,å é¤
        print('å é¤ç¹æ®çåä¸¤ä¸ª')
        print(list1)

        str_temp1=list1[4]+list1[5]  #ç¬¬5,6åå¹¶ä¸¤ä¸ªåç´ ä¸ºä¸ä¸ª
        print(str_temp1)
        del list1[5]
        list1[4]=str_temp1
        print("åç´ åå¹¶å®æ")
        print(list1)

        str_temp2=list1[1]+list1[2]    #ç¬¬äºä¸åç´ åå¹¶å®æ
        del list1[2]
        list1[1]=str_temp2
        
        list.append(list1) 
        print("æç»è¡æ°æ®")
        print(list1)
        #list1.clear()       

    #print(list) 
    list_data=[]  
    for i in list:                   #å·²å°å°¾æ¥ææ°æ®åå¹¶æå¹´ææ¥ æ¶åç§
        list_data.append(merge(i))
    del list_data[0]          #å é¤æåè¡¨å¤´   
    count=count-1             #å é¤äºè¡¨å¤´,æ»æ°æ®çè¡æ°åä¸
    #print(list_data)
    #list_temp=remove_Duplicates_list(list_data)[:]    #å°æææ°æ®å¤å¶ç»ä¸´æ¶åè¡¨list_temp   æ¯å»é¤éå¤åçåè¡¨
    list_temp=list_data[:]
    return count


def get_MorePages_teshu_shiqijia(url,page_num):
    global sleeptime
    global already_spider_datanum
    urls=list_url(url,page_num)   #å¾å°éè¦éåçé¡µçurl
    count_all=0          #ä¿åæ°æ®çæ»è¡æ°
    list_all=[]          #ä¿åç¬åçææçæ°æ®
    page=1
    for i in urls:
        count=0
        count_all=count_all+get_OnePage_teshu_shiqijia(i,count)
        if len(list_temp)==0:        #å¦æè¯¥é¡µä¸ºç©ºï¼åè¡¨ç¤ºè¯¥é¡µåé¢é½æ æ°æ®  éåºå¾ªç¯
            print('åé¢é¡µæ°ä¸ºç©ºï¼ç¬å»ä¸ä¸ä¸ªåºéº')
            break  
        list_all.extend(list_temp)   #å°åè¡¨è¿½å å°list_allä¸
        print("ç¬åäºç¬¬",page,"é¡µ")
        page=page+1
        print("\n")
        time.sleep(sleeptime)         #é´é2ç§è¯·æ±ä¸æ¬¡

    for j in list_all:
        print(j)              #æå°åè¡¨ä¸æ¯ä¸è¡
    print("æ»è¡æ°ä¸º:",count_all)
    already_spider_datanum += count_all #å·²ç¬åæ°æ®çæ»å
    return list_all



#-------------------------------------------------------------------------------------------------------------ç¹æ®çurl
def get_OnePage_teshu(url,count):     #æåä¸é¡µçæ°æ®,æ¾å¥list_dataä¸.urlsä¸ºè¦è®¿é®çç½é¡µå°å
    # global ck
    global list_temp    #ä½¿ç¨å¨å±åé

    list_temp.clear()  #æ¸ç©ºä¸´æ¶è¡¨
    # session.headers = {
    #     # æ¤å¤æ³¨æcookieï¼è¦èªå·±æå
    #     # "Cookie":ck,
    #     "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36",
    # }
    r = session.get(url,  verify=False).text
    soup = bs(r,'html.parser')

    list=[]                     #åå»ºåè¡¨æ¥ä¿åç»æ
   
    tags = soup.find_all("tr")  # åè¡¨ææè¡
    for tag in tags:  # æ¯ä¸ªtagæ¯ä¸è¡
        count=count+1
        element = tag.text  # è·å<tr>æ ç¾åææææ¬ä¿¡æ¯
        element = element.strip()  # å°åç¬¦ä¸²é¦å°¾ç©ºæ ¼å»é¤
        list1 = element.split();  # ä»¥ç©ºæ ¼ä¸ºåéå°åç¬¦ä¸²åä¸ºåè¡¨

        del (list1[-2:])            #åè¡¨æåä¸¤ä¸ªåç´ ä¸éè¦,å é¤
        print('å é¤ç¹æ®çåä¸¤ä¸ª')
        print(list1)
        list.append(list1) 
        #list1.clear()       

    #print(list) 
    list_data=[]  
    for i in list:                   
        list_data.append(merge(i))   #å°å°¾æ¥ææ°æ®åå¹¶æå¹´ææ¥ æ¶åç§
    del list_data[0]          #å é¤æåè¡¨å¤´   
    count=count-1             #å é¤äºè¡¨å¤´,æ»æ°æ®çè¡æ°åä¸
    #print(list_data)
    #list_temp=remove_Duplicates_list(list_data)[:]    #å°æææ°æ®å¤å¶ç»ä¸´æ¶åè¡¨list_temp   æ¯å»é¤éå¤åçåè¡¨
    list_temp=list_data[:]
    return count


def get_MorePages_teshu(url,page_num):   #ç¬åæå®åºéºåçå¤é¡µæ°æ®,pge_numè¡¨ç¤ºç¬åçé¡µæ°
    global sleeptime
    global already_spider_datanum
    urls=list_url(url,page_num)   #å¾å°éè¦éåçé¡µçurl  è¿åè¯¥urlå¯¹åºé¡µçææé¾æ¥å½¢å¼ï¼è¿åå¼ä¸ºåè¡¨
    count_all=0          #ä¿åæ°æ®çæ»è¡æ°
    list_all=[]          #ä¿åç¬åçææçæ°æ®
    page=1
    for i in urls:
        count=0
        count_all=count_all+get_OnePage_teshu(i,count)
        if len(list_temp)==0:        #å¦æè¯¥é¡µä¸ºç©ºï¼åè¡¨ç¤ºè¯¥é¡µåé¢é½æ æ°æ®  éåºå¾ªç¯
            print('åé¢é¡µæ°ä¸ºç©ºï¼ç¬å»ä¸ä¸ä¸ªåºéº')
            break  
        list_all.extend(list_temp)   #å°åè¡¨è¿½å å°list_allä¸
        print("ç¬åäºç¬¬",page,"é¡µ")
        page=page+1
        print("\n")
        time.sleep(sleeptime)         #é´é2ç§è¯·æ±ä¸æ¬¡

    for j in list_all:
        print(j)              #æå°åè¡¨ä¸æ¯ä¸è¡
    print("æ»è¡æ°ä¸º:",count_all)
    already_spider_datanum += count_all #å·²ç¬åæ°æ®çæ»å
    return list_all


def spilt_url_teshu(con,page,date_begin=month_begin,date_end=now_date):        #åå¯¹ç¹æ®çurlåå¤ç,åè¿æ»¤
    global already_spider_shopnum
    global all_data
    urls=url_more()   #è¿åæä»¶ä¸ææåºéºçurl,å¸¦æå¤§æ¾ç¤ºæ¡æ°100 ãurlsæ¯åè¡¨
    #print(urls)
    teshu_url=[]
    special_url=['shop=%25E4%25BA%25BA%25E7%2594%259F%25E4%25B8%2580%25E4%25B8%25B2','shop=%25E7%25BC%2598%25E5%25AE%25B6','shop=%25E4%25B8%25B0%25E8%258C%2582%25E7%2583%25A4%25E4%25B8%25B2','shop=%25E6%25B3%25B0%25E7%2585%258C%25E9%25B8%25A1','shop=%25E5%25B0%258F%25E9%2593%2581%25E5%2590%259B']

    for url in urls:          #éåææåºéºçurl
        begin=url.find('&')+1
        end=url.rfind('&')
        #print(begin,end)
        #æ¾å°ç¹æ®çurl,è¿è¡ç¹æ®å¤ç
        if url[begin:end] in special_url:   
            print('åç°ç¹æ®çï¼')
            already_spider_shopnum += 1   # ç¬å»çåºéºæ°éå 1
            teshu_url.append(url)
            #åå é¤ä¸ä¸ªåè¡¨åç´ 
            url_teshu=url_add_time(url,date_begin,date_end)  # ç»ææurlå ä¸æ¥æ
            list_to_MySql=get_MorePages_teshu(url_teshu,page)    # åºéºçurl,ç¬åçé¡µæ°
           
            if len(list_to_MySql) == 0 :
                print('è¯¥å®¶åºéºæ¶é´æ®µæ æ°æ®ï¼å·²è·³è¿')
                continue
            has_remove_duplicates = remove_Duplicates_list(list_to_MySql)   #å»é¤æä¸ªåºéºæå®é¡µæ°ææéå¤çæ°æ®
            for item in has_remove_duplicates:
                all_data.append(item)
         
            list_to_MySql.clear()
        if url[begin:end]=='shop=%25E9%25A3%259F%25E5%2585%25B6%25E5%25AE%25B6':   #é£å¶å®¶
            print('åç°ç¹æ®çï¼')
            already_spider_shopnum += 1   #ç¬å»çåºéºæ°éå 1
            teshu_url.append(url)
            #åå é¤ä¸ä¸ªåè¡¨åç´ 
            url_teshu=url_add_time(url,date_begin,date_end)  #ç»ææurlå ä¸æ¥æ
            list_to_MySql=get_MorePages_teshu_shiqijia(url_teshu,page)    #åºéºçurl,ç¬åçé¡µæ°
           
            if len(list_to_MySql) == 0 :
                print('è¯¥å®¶åºéºæ¶é´æ®µæ æ°æ®ï¼å·²è·³è¿')
                continue
            has_remove_duplicates = remove_Duplicates_list(list_to_MySql)   #å»é¤æä¸ªåºéºæå®é¡µæ°ææéå¤çæ°æ®
            for item in has_remove_duplicates:
                all_data.append(item)
        
            list_to_MySql.clear()
    for t in teshu_url:     #ä»urlsè¡¨ä¸å é¤ç¹æ®ç
        urls.remove(t)
    print(len(urls))
    return urls

#-------------------------------------------------------------------------------------------------------------


def spider_all(con,page,date_begin=month_begin,date_end=now_date):    #ç¬åæä»¶ä¸ææåºéº(åæ¬ç¹æ®çurlåºéº)    æ°æ®åºè¿æ¥å¯¹è±¡ ,è¦ç¬åçé¡µæ°,å¼å§æ¶é´,ç»ææ¶é´
    global already_spider_shopnum 
    global all_data
    url_all=[]

    urls=url_more()   #è¿åæä»¶ä¸ææåºéºçurl,å¸¦æå¤§æ¾ç¤ºæ¡æ°100 ãurlsæ¯åè¡¨
    for url in urls:  #ç»ææurlå ä¸æ¥æ
        url_all.append(url_add_time(url,date_begin,date_end))
  
    for i in url_all:   #æå°æç»çurl
        print(i)

    for j in url_all:     #æ ¹æ®ææurlåå¥æ°æ®åº     
        list_to_MySql=get_MorePages(j,page)    #åºéºçurl,ç¬åçé¡µæ°
        already_spider_shopnum += 1   #ç¬å»çåºéºæ°éå 1

        if len(list_to_MySql) == 0 :
            print('è¯¥å®¶åºéºæ¶é´æ®µæ æ°æ®ï¼å·²è·³è¿')
            continue
        has_remove_duplicates = remove_Duplicates_list(list_to_MySql)   #å»é¤æä¸ªåºéºæå®é¡µæ°ææéå¤çæ°æ®
        for item in has_remove_duplicates:
                all_data.append(item)

        list_to_MySql.clear()




def write_Sql(list,con):      #å°ç½ç«æ°æ®åå¥æ°æ®åº
    data = pd.DataFrame(list,columns=['provider','shop_name','equipment_number','equipment_name','smoke_push_density','smoke_pop_density','wind_turbine','purifier','level','alarm_required','alarm_triggered','attribution_time','reporting_time','data_time'])
    print("\n\n")
    print(data)

    # test3 è¦åå¥çæ°æ®è¡¨ï¼è¿æ ·åçè¯è¦æåå¨æ°æ®åºå»ºå¥½è¡¨
    data.to_sql(name="ed_data", con=con, if_exists="append",index=False,index_label=False)
    print("åå¥å®æ!")

# ck=""     #ä¿åcookie
session = requests.session()
webshops=[]
shopnum=0   #æä»¶ä¸åºéºæ»æ°
already_spider_shopnum=0   #å·²ç¬åçåºéºæ°é
already_spider_datanum=0   #å·²ç¬åçæ°æ®æ¡æ°
sleeptime=8

Key_period_noon_begin = datetime.strptime('10:00',"%H:%M")    #ä¸åéç¹æ¶æ®µ
Key_period_noon_end = datetime.strptime('14:00',"%H:%M")


Key_period_night_begin = datetime.strptime('17:00',"%H:%M")   #æä¸éç¹æ¶æ®µ
Key_period_night_end = datetime.strptime('21:00',"%H:%M")

engine = create_engine("mysql+pymysql://fumeRemote:feiyu2023@114.215.109.124:3306/fume?charset=utf8")



# ä¸é¨è¯»åè®¾å¤ä¿¡æ¯è¡¨
con_read = engine.connect()

all_data = []
def pass_login(ses,beginTime,endTime,shops):
    global con_read
    # global ck 
    global session 
    global webshops

    global all_data
    global shopnum
    global already_spider_shopnum
    global already_spider_datanum
    # åå§å é²æ¢å½±åä¸æ¬¡
    all_data.clear()
    shopnum=0
    already_spider_shopnum=0
    already_spider_datanum=0

    # åå§åsession
    session = ses
    webshops = shops[:]
    print(f'è·åæ°æ®çæ¶é´åºé´ä¸ºï¼{beginTime}-{endTime}')
    print('ä¼ å¥çåºéºåç§°ä¸ºï¼',shops)
   
    engine = create_engine("mysql+pymysql://fumeRemote:feiyu2023@114.215.109.124:3306/fume?charset=utf8")
    con = engine.connect()


    #ç¬åææåºéº  å¹¶è®¡ç®èæ¶
    start_time=time.time()

    spider_all(con,100,beginTime,endTime)  #ç¬åæä»¶ä¸ææçåºéºå
     # ç»æææ°æ®æåä¸ä¸ªåæ®µæ è®°ä¸ºâ0âï¼è¡¨ç¤ºä¸éå¤
    for item in all_data:
        item.append(0)
        
    end_time=time.time()
    # å³éæ°æ®åºè¿æ¥

    con_read.close()
    con.close()
    
    print("è·åæ°æ®å®æ!")
    print("è®¾ç½®è·åçæ¶é´é´éä¸º",sleeptime,"ç§")
    print("å±æ",shopnum,"å®¶","å·²è·å",already_spider_shopnum,"å®¶")
    print("å±è·å",already_spider_datanum,"æ¡è®°å½")
    print("å±èæ¶:{:.2f}ç§".format(end_time-start_time))

    result=[]
    result.append('è·åæ°æ®å®æ!')
    result.append("å±æ"+str(shopnum)+"å®¶ï¼å·²è·å"+str(already_spider_shopnum)+"å®¶")
    result.append("å±è·å"+str(already_spider_datanum)+"æ¡è®°å½")
    result.append("å±èæ¶:{:.2f}ç§".format(end_time-start_time))
    
    return result,all_data



# pass_login()

 src/__pycache__/Crawling.cpython-38.pyc

Binary files differ

 src/__pycache__/Crawling_1.cpython-38.pyc

Binary files differ

 src/__pycache__/write_to_MySql.cpython-38.pyc

Binary files differ

 src/__pycache__/write_to_minute_table.cpython-38.pyc

Binary files differ

 src/write_to_MySql.py

@@ -7,7 +7,6 @@
from datetime import datetime, timedelta

import sys
# sys.path.append('D:\\z\workplace\\VsCode\\pyvenv\\venv')
sys.path.append('../../')
import src.core_modules.remove_duplicates_methods as rdm

@@ -107,7 +106,7 @@
            temp=[] 
            temp.append(item[2])  #è®¾å¤ç¼å·
            temp.append('è®¾å¤æé')  #è®¾å¤ç¼å·
            temp.append('1') #è®¾å¤æé
            temp.append('1') #ä¾çµå¼å¸¸
            temp.append('å¾æ±åº')
            temp.append(item[11])    #æéå¼å§æ¶é´
            startTimeSub= datetime.strptime(startTime,"%Y-%m-%d %H:%M") - timedelta(minutes = 10) #ç»æä¸ºdatetime.datetimeç±»å ï¼éè¦åè½¬ä¸ºåç¬¦ä¸²ç±»å
@@ -178,6 +177,7 @@
    for i in power_supply_abnormal :
        print(i)
    

    #å°ä¾çµå¼å¸¸çä¿¡æ¯åå¥æ°æ®åºå¼å¸¸è¡¨ä¸
    abnormal_write_to_SQL(power_supply_abnormal,con)   #å°è®¾å¤æéä¿¡æ¯åå¥å¼å¸¸è¡¨
    print('ä¾çµå¼å¸¸çä¿¡æ¯åå¥å¼å¸¸è¡¨å®æ!')
@@ -314,9 +314,12 @@
def refind_ea(list):  #ä¸æ¡è®°å½ï¼ä¹å°±æ¯ä¸ä¸ªåè¡¨
    temp=[]
    temp.append(generate_short_uuid())
    # è®¾å¤ç¼å·
    temp.append(list[2])
    # åºéºåå
    temp.append(list[1])
    temp.append(list[0])
    # ä¾åºå
    temp.append(list[3])
    temp.append(1)
    print(temp)
    return temp
@@ -388,7 +391,7 @@
    temp.append(list[7])   #ååå¨çµæµ 7
    temp.append(list[4])   #è¿æ²¹çæµåº¦å¼
    temp.append(list[5])   #ææ²¹çæµåº¦å¼
    temp.append(list[14])  #éå¤çæ¬¡æ°
    temp.append(list[13])  #éå¤çæ¬¡æ°

    print(temp)
    return temp

 src/write_to_minute_table.py

@@ -16,7 +16,7 @@
    temp.append(list[7])   #ååå¨çµæµ 7
    temp.append(list[4])   #è¿æ²¹çæµåº¦å¼
    temp.append(list[5])   #ææ²¹çæµåº¦å¼
    temp.append(list[14])  #éå¤çæ¬¡æ°
    temp.append(list[13])  #éå¤çæ¬¡æ°

    print(temp)
    return temp

 test_get_data/__init__.py


 test_get_data/__pycache__/__init__.cpython-38.pyc

Binary files differ

 test_get_data/__pycache__/__init__.cpython-39.pyc

Binary files differ

 test_get_data/__pycache__/login.cpython-38.pyc

Binary files differ

 test_get_data/__pycache__/login.cpython-39.pyc

Binary files differ

 test_get_data/__pycache__/request.cpython-38.pyc

Binary files differ

 test_get_data/__pycache__/request.cpython-39.pyc

Binary files differ

 test_get_data/__pycache__/url_help.cpython-38.pyc

Binary files differ

 test_get_data/__pycache__/url_help.cpython-39.pyc

Binary files differ

 test_get_data/database_connect.py

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,86 @@
import sys
import os
sys.path.append(os.path.dirname(__file__))
# sys.path.append('E:\\ruanjian\\Python\\Lib\\site-packages')



from sqlalchemy import create_engine
class DataBase:
    """ è¿ç¨æ°æ®åº """
    # con_read = None
    # con_write = None
    # ip = '114.215.109.124'
    # user = 'fumeRemote'
    # password = 'feiyu2023'
    # port = 3306
    # data_base_name = 'fume'


    """ æ¬æº """
    con_read = None
    con_write = None
    ip = 'localhost'
    user = 'root'
    password = '1234'
    port = 3306
    data_base_name = 'qianduan_sql'



    """è¿æ¥æ°æ®åº
    """
    def connect_remote_database_read(self):


        if self.con_read == None or self.con_read.closed:
            engine = create_engine(f"mysql+pymysql://{self.user}:{self.password}@{self.ip}:{self.port}/{self.data_base_name}?charset=utf8",pool_recycle=3600, pool_size=3, max_overflow=0)
            self.con_read = engine.connect()
        return self.con_read

    def connect_remote_database_write(self):
        """ å"""

    
        if self.con_write == None or self.con_write.closed:
            engine = create_engine(f"mysql+pymysql://{self.user}:{self.password}@{self.ip}:{self.port}/{self.data_base_name}?charset=utf8",pool_recycle=3600, pool_size=3, max_overflow=0)
            self.con_write = engine.connect()
        return self.con_write


    # """ è¿æ¥æ¬å°æ°æ®åº 
    # """
    # def connect_local_database_read(self):
    #     """ è¯»æ°æ®
    #     """
    #     if self.con_read == None or self.con_read.closed:
    #         engine = create_engine(f"mysql+pymysql://{self.user}:{self.password}@{self.ip}:{self.port}/{self.data_base_name}?charset=utf8")
    #         self.con_read = engine.connect()
    #     return self.con_read

    # def connect_local_database_write(self):
    #     """ åæ°æ®
    #     """
    #     if self.con_write == None or self.con_write.closed:
    #         engine = create_engine(f"mysql+pymysql://{self.user}:{self.password}@{self.ip}:{self.port}/{self.data_base_name}?charset=utf8")
    #         self.con_write = engine.connect()
    #     return self.con_write


    def disconnect(self,area_type:str,option_type:str):
        """"æå¼è¿æ¥

        Args:
            area_type (str): æ°æ®åºæå±ä½ç½®ãlocalä¸remote
            option_type (str): æä½ç±»åãwriteåread
        """

        self.con_read.close()


# å¶ä»æä»¶å¯¼å¥æ¤å¯¹è±¡å³å¯ 
datebase_single_obj = DataBase()

if __name__ == '__main__':
    # print(datebase_single_obj.connect_remote_database_read()) 
    pass

 test_get_data/get_data.py

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,92 @@
from test_get_data.request import request_get
from test_get_data.url_help import Url
from test_get_data.login import *

from bs4 import BeautifulSoup as bs  
import re              #æ£åè¡¨è¾¾å¼
import time

import sys
sys.path.append('../../')
import src.core_modules.remove_duplicates_methods as rdm

now_date = time.strftime("%Y-%m-%d", time.localtime())    #è·åå½åå¹´ææ¥  #urlç¼ç å¹´ææ¥å¼å§é»è®¤æ¶é´
now_date1 = time.strftime("%Y-%m", time.localtime())  
month_begin=now_date1+'-01'                 #è®¾ç½®å½åæä»½çå¼å§

list_temp=[]  #ä¸´æ¶åè¡¨  å¨å±åé



#-------------------------------------------------------------------------------------------------------------ç¹æ®çurl
def get_OnePage_teshu(url,count=1):     #æåä¸é¡µçæ°æ®,æ¾å¥list_dataä¸.urlsä¸ºè¦è®¿é®çç½é¡µå°å
    global list_temp    #ä½¿ç¨å¨å±åé

    list_temp.clear()  #æ¸ç©ºä¸´æ¶è¡¨

    r = request_get(url).text
    soup = bs(r,'html.parser')

    list=[]                     #åå»ºåè¡¨æ¥ä¿åç»æ
   
    # æ¾å°ææçtræ ç¾
    rows = soup.find_all('tr')

    # æåè¡¨æ ¼ä¸çæ°æ®
    result = []
    for row in rows:
        data = []
        cols = row.find_all('td')
        for col in cols:
            if col.find('div'):
                # å¦ætdä¸åå«divï¼ååç¬æåå¶åå®¹
                div_content = col.find('div').text.strip()
                # data.append(col.find('td').text.strip())
                # è¿ååç´ çææ¬åå®¹ æç´¢tagçç´æ¥åèç¹
                td_content = ''.join(col.find_all(text=True, recursive=False)).strip()
                data.append(td_content)
                data.append(div_content)
            else:
                # å¦ætdä¸ä¸åå«divï¼åç´æ¥æåtdçåå®¹
                td_content = col.text.strip()
                data.append(td_content)
        del (data[-2:])
        del (data[2])
        result.append(data)
     # å é¤è¡¨å¤´
    del (result[0])
    # æå°æåçæ°æ®
    print(result)

  

    # for tag in tags:  # æ¯ä¸ªtagæ¯ä¸è¡
    #     element = tag.text  # è·å<tr>æ ç¾åææææ¬ä¿¡æ¯
    #     element = element.strip()  # å°åç¬¦ä¸²é¦å°¾ç©ºæ ¼å»é¤
    #     list1 = element.split();  # ä»¥ç©ºæ ¼ä¸ºåéå°åç¬¦ä¸²åä¸ºåè¡¨

    #     # del (list1[-2:])            #åè¡¨æåä¸¤ä¸ªåç´ ä¸éè¦,å é¤
    #     # print('å é¤ç¹æ®çåä¸¤ä¸ª')
    #     # print(list1)
    #     list.append(list1) 
    # print(list)

    # list_data=[]  
    # for i in list:                   
    #     list_data.append(merge(i))   #å°å°¾æ¥ææ°æ®åå¹¶æå¹´ææ¥ æ¶åç§
    # del list_data[0]          #å é¤æåè¡¨å¤´   
    # count=count-1             #å é¤äºè¡¨å¤´,æ»æ°æ®çè¡æ°åä¸
    # #print(lt_isates_list(list_data)[:]    #å°æææ°æ®å¤å¶ç»ä¸´æ¶åè¡¨list_temp   æ¯å»é¤éå¤åçåè¡¨
    # list_temp=list_data[:]
    # return count

if __name__ == '__main__':
    # ç»å½
    login_fume_web()
    u = Url()
    urls = u.concatenate_url_with_condition('æ¨è®°é½é½åå°ç¤è','2023-10-01','2023-10-31',1)
    for item in urls:
        get_OnePage_teshu(item)

    


 test_get_data/login.py

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,64 @@
from test_get_data.request import request_post,request_get
import time
import json
import base64

import src.user.account_photo as account

def get_time():
    # æ¯«ç§å¦çº§æ¶é´æ³ 13ä½æ°å
    now_time = str(int(time.time()*1000))
    return now_time

def get_photo_url(url):
    return url + get_time()



def base64_api(img):
    # è¿åè´¦å·å¯ç 
    uname,pwd = account.back_account_password()
    with open(img, 'rb') as f:
        base64_data = base64.b64encode(f.read())
        b64 = base64_data.decode()
    data = {"username": uname, "password": pwd, "typeid": 2, "image": b64}
    result = json.loads(request_post("http://api.ttshitu.com/predict", data))
    if result['success']:
        return result["data"]["result"]
    else:
        #ï¼ï¼ï¼ï¼ï¼ï¼ï¼æ³¨æï¼è¿å äººå·¥ä¸è¶³ç éè¯¯æåµ è¯·å é»è¾å¤çé²æ¢èæ¬å¡æ» ç»§ç»éæ° è¯å«
        return result["message"]
    return ""



def login_fume_web():
    # è¯·æ±éªè¯ç å°å
    # æé æ¶é´æ³
    # æ¼æ¥url
    # è¯å«éªè¯ç 
    url_photo = get_photo_url('http://xhhb.senzly.cn/servlet/Vcode_new.serv?t=')
    response = request_get(url_photo)         # å¾çä¸ºäºè¿å¶æ°æ®
    image_data = response.content
    with open('Vcode.jpg',mode='wb') as f:
        f.write(image_data)
    # éªè¯ç ç»æ
    v_code_result = base64_api('Vcode.jpg')


    play_load = {
        "account": "9SUBjEeNy7nFMzk123",
        "password": "6SUBIyusanb170e13a221a4cb58c66876006488504",
        "vcode": v_code_result
    }

    url_jump = 'http://xhhb.senzly.cn/cusLogin.php'
    request_post(url_jump,play_load)
    print('ç»å½æå')

    # return session
    # ä¸ªäººéªè¯


if __name__ == '__main__':
    login_fume_web()

 test_get_data/request.py

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,37 @@
import requests
import urllib3

class MyRequest:
    def __init__(self):
        urllib3.disable_warnings()
        self.session = requests.session()
        self.session.headers = {
           "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36",
        }

    def get(self,url:str):
        r = self.session.get(url, verify=False)
        if r.status_code != 200:
            return False
        return r

    def post(self, url: str, params: dict):
        """postè¯·æ±

        Args:
            url (str): ç®æ url
            params (dict): è¯·æ±åæ°

        Returns:
            _type_: ååºåå®¹
        """
        r = self.session.post(url, data=params, verify=False)
        if r.status_code != 200:
            return False
        return r.text



_my_request = MyRequest()
request_post = _my_request.post
request_get  = _my_request.get

 test_get_data/url_help.py

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,36 @@
import urllib.parse 

class Url:
    
    def concatenate_url_with_condition(self,shop_name,date_begin,date_end,page_num)->list:
        """å½¢æå®æ´çurl"""
        # ååç¼ç 
        base_url = self.encoding_shop_name(shop_name)
        # å ä¸æ¥ææ¡ä»¶
        url_with_date = self.url_add_date(base_url,date_begin,date_end)
        # å ä¸é¡µæ°æ¡ä»¶
        sub_urls_wait_for_request = self.list_add_page(url_with_date,page_num)
        return sub_urls_wait_for_request



    def url_add_date(self,url,date_begin,date_end):     #url,å¹´-æ-æ¥ 2023-05-03
        url_date=url+'&key5='+date_begin+'&key6='+date_end
        return url_date
    
    def list_add_page(self,url,page_num):  # urlä¸çiæ¯é¡µ ,apge_numè¡¨ç¤ºç¬åçé¡µæ°  ãurlåé¢å ä¸é¡µçåæ°
        urls = [url+'&page'+'={}'.format(str(i)) for i in range(1,page_num+1)]
        return urls 
    
    def encoding_shop_name(self,shop_name):
        encoded_shop_name = urllib.parse.quote(urllib.parse.quote(shop_name))
       
        return 'http://xhhb.senzly.cn/sys/yyRealTimeValue_list.jsp?key1=&shop='+encoded_shop_name+'&pagesize=100'
    


if __name__ == '__main__':
    u = Url()
    urls = u.concatenate_url_with_condition('é£å¶å®¶','2023-10-01','2023-10-31',5)
    for item in urls:
        print(item)

			@@ -2,10 +2,9 @@
			from flask_cors import CORS

			import sys
			# sys.path.append('D:\\z\workplace\\VsCode\\pyvenv\\venv')
			sys.path.append('../')

			import src.Crawling as Crawling
			import src.Crawling_1 as Crawling
			import src.auto_login as login
			import pandas as pd
			from sqlalchemy import create_engine
			@@ -22,19 +21,17 @@

			session = -1


			# æ¨¡æç»éå¹¶ç¬åæ°æ®
			@app.route('/getData',methods=['POST'])
			def get_data():
			if request.method == 'POST':
			data=request.get_json()
			if(session != -1) :
			# if(len(session.cookies.get_dict()) == 0):
			# # sessionå¤±æ
			# return '-2'

			result,all_data=Crawling.pass_login(session,data.get('beginTime'),data.get('endTime'),data.get('selectedShopNames'))
			print('\n\nç¬åçææçallData\n',all_data)
			duplicate_data,new_data=is_duplicate(all_data)
			# if(len(duplicate_data)==0):
			# duplicate_data.append('æ éå¤æ°æ®')
			print('éå¤çæ°æ®ä¸ºï¼',duplicate_data)
			jso ={
			# åé¦ä¿¡æ¯
			@@ -51,24 +48,22 @@
			return '-1'
			return jsonify(jso)

			# åå¥æ°æ®åº åå¥4å¼ è¡¨ä¸
			# å¯¹æ°æ®è¿è¡å¼å¸¸åæï¼å°ç»æåå¥å¼å¸¸è¡¨ï¼è®¾å¤ä¿¡æ¯è¡¨ï¼åéæ°æ®è¡¨
			@app.route('/store',methods=['POST'])
			def write_new():
			if request.method =='POST':
			data = request.get_json()
			# print('dataä¸ºï¼',data.get('allData'))
			# print('è¦åå¥çæ°æ®æ¡æ°ä¸ºï¼',len(data.get('allData')))

			# åå¥æ°æ®åº
			w_t_MySql.write(data.get('allData'))
			return 'åå¥å®æï¼'

			# åå¥æ°æ®åº åªåå¥åéæ°æ®è¡¨

			# åªåå¥åéæ°æ®è¡¨
			@app.route('/minute',methods=['POST'])
			def write_dup():
			if request.method =='POST':
			data = request.get_json()
			# print('dataä¸ºï¼',data.get('allData'))
			# print('è¦åå¥çæ°æ®æ¡æ°ä¸ºï¼',len(data.get('allData')))
			# åå¥æ°æ®åº
			w_t_minute.write(data.get('allData'))
			return 'åå¥å®æï¼'
			@@ -88,25 +83,18 @@
			# lstä¸ºè¦åæ°æ®åºå·²åçæ°æ®è¿è¡æ¯è¾ï¼lståç´ åªéè¦3ä¸ªåæ®µã è¿åå¼æ¯éå¤çæ°æ®
			def is_duplicate(lst):
			temp=copy.deepcopy(lst)
			# print('temp',temp)
			# print('\n')
			# åªä¿å3ä¸ªåæ®µ
			after_address=[]
			for item in temp:
			# print('item',item)
			# print('\n')
			a=[]
			# åºéºååè®¾å¤ç¼å·
			a.append(item[1])
			# print('item1',item[1])
			# print('\n')

			a.append(item[2])
			# å½å±æ¶é´
			time=str(item[11])+':00'
			a.append(time)
			# print('a',a)
			# print('\n')

			after_address.append(a)

			engine = create_engine("mysql+pymysql://fumeRemote:feiyu2023@114.215.109.124:3306/fume?charset=utf8")

			@@ -120,7 +120,8 @@
			count_all=count_all+get_OnePage(i,count)
			if len(list_temp)==0: #å¦æè¯¥é¡µä¸ºç©ºï¼åè¡¨ç¤ºè¯¥é¡µåé¢é½æ æ°æ® éåºå¾ªç¯
			print('åé¢é¡µæ°ä¸ºç©ºï¼ç¬å»ä¸ä¸ä¸ªåºéº')
			break #éåºå¾ªç¯
			break
			#éåºå¾ªç¯
			list_all.extend(list_temp) #å°ä¸é¡µæ°æ®åè¡¨è¿½å å°list_allä¸
			print("ç¬åäºç¬¬",page,"é¡µ")
			page=page+1
			@@ -604,11 +605,7 @@
			global ck
			global list_temp #ä½¿ç¨å¨å±åé
			list_temp.clear() #æ¸ç©ºä¸´æ¶è¡¨
			# session.headers = {
			# # æ¤å¤æ³¨æcookieï¼è¦èªå·±æå
			# # "Cookie":ck,
			# "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36",
			# }

			r = session.get(url, verify=False).text
			soup = bs(r,'html.parser')

			@@ -686,11 +683,7 @@
			global list_temp #ä½¿ç¨å¨å±åé

			list_temp.clear() #æ¸ç©ºä¸´æ¶è¡¨
			# session.headers = {
			# # æ¤å¤æ³¨æcookieï¼è¦èªå·±æå
			# # "Cookie":ck,
			# "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36",
			# }

			r = session.get(url, verify=False).text
			soup = bs(r,'html.parser')

			@@ -707,7 +700,6 @@
			print('å é¤ç¹æ®çåä¸¤ä¸ª')
			print(list1)
			list.append(list1)
			#list1.clear()

			#print(list)
			list_data=[]
			@@ -753,36 +745,27 @@
			urls=url_more() #è¿åæä»¶ä¸ææåºéºçurl,å¸¦æå¤§æ¾ç¤ºæ¡æ°100 ãurlsæ¯åè¡¨
			#print(urls)
			teshu_url=[]
			#'shop=%25E9%25A3%259F%25E5%2585%25B6%25E5%25AE%25B6' é£å¶å®¶
			special_url=['shop=%25E4%25BA%25BA%25E7%2594%259F%25E4%25B8%2580%25E4%25B8%25B2','shop=%25E7%25BC%2598%25E5%25AE%25B6','shop=%25E4%25B8%25B0%25E8%258C%2582%25E7%2583%25A4%25E4%25B8%25B2','shop=%25E6%25B3%25B0%25E7%2585%258C%25E9%25B8%25A1','shop=%25E5%25B0%258F%25E9%2593%2581%25E5%2590%259B']

			for url in urls: #éåææåºéºçurl
			begin=url.find('&')+1
			end=url.rfind('&')
			#print(begin,end)
			#æ¾å°ç¹æ®çurl,è¿è¡ç¹æ®å¤ç
			if url[begin:end] in special_url:
			print('åç°ç¹æ®çï¼')
			already_spider_shopnum += 1 #ç¬å»çåºéºæ°éå 1
			already_spider_shopnum += 1 # ç¬å»çåºéºæ°éå 1
			teshu_url.append(url)
			#åå é¤ä¸ä¸ªåè¡¨åç´
			url_teshu=url_add_time(url,date_begin,date_end) #ç»ææurlå ä¸æ¥æ
			list_to_MySql=get_MorePages_teshu(url_teshu,page) #åºéºçurl,ç¬åçé¡µæ°
			# a=remove_Duplicates_list(list_to_MySql)
			# print('\n')
			# for item in a:
			# print(item)
			url_teshu=url_add_time(url,date_begin,date_end) # ç»ææurlå ä¸æ¥æ
			list_to_MySql=get_MorePages_teshu(url_teshu,page) # åºéºçurl,ç¬åçé¡µæ°

			if len(list_to_MySql) == 0 :
			print('è¯¥å®¶åºéºæ¶é´æ®µæ æ°æ®ï¼å·²è·³è¿')
			continue
			has_remove_duplicates = remove_Duplicates_list(list_to_MySql) #å»é¤æä¸ªåºéºæå®é¡µæ°ææéå¤çæ°æ®
			for item in has_remove_duplicates:
			all_data.append(item)
			# is_minutes_exceed_30(has_remove_duplicates,con) # å°æå®é¡µæ°çè®¾å¤æéæ°æ®åå¥æ°æ®åºå¼å¸¸è¡¨ä¸
			# isExceeding(has_remove_duplicates,con) # å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºè¶æ è¡¨ä¸
			# ea_t_dev(has_remove_duplicates,con) # å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºè®¾å¤ä¿¡æ¯è¡¨ä¸
			# fd_t_minbute(has_remove_duplicates,con) #å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºåéæ°æ®è¡¨ä¸


			list_to_MySql.clear()
			if url[begin:end]=='shop=%25E9%25A3%259F%25E5%2585%25B6%25E5%25AE%25B6': #é£å¶å®¶
			print('åç°ç¹æ®çï¼')
			@@ -800,11 +783,7 @@
			has_remove_duplicates = remove_Duplicates_list(list_to_MySql) #å»é¤æä¸ªåºéºæå®é¡µæ°ææéå¤çæ°æ®
			for item in has_remove_duplicates:
			all_data.append(item)
			# is_minutes_exceed_30(has_remove_duplicates,con) # å°æå®é¡µæ°çè®¾å¤æéæ°æ®åå¥æ°æ®åºå¼å¸¸è¡¨ä¸
			# isExceeding(has_remove_duplicates,con) # å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºè¶æ è¡¨ä¸
			# ea_t_dev(has_remove_duplicates,con) # å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºè®¾å¤ä¿¡æ¯è¡¨ä¸
			# fd_t_minbute(has_remove_duplicates,con) #å°æå®é¡µæ°æ°æ®åå¥æ°æ®åºåéæ°æ®è¡¨ä¸


			list_to_MySql.clear()
			for t in teshu_url: #ä»urlsè¡¨ä¸å é¤ç¹æ®ç
			urls.remove(t)

			@@ -7,7 +7,6 @@
			from datetime import datetime, timedelta

			import sys
			# sys.path.append('D:\\z\workplace\\VsCode\\pyvenv\\venv')
			sys.path.append('../../')
			import src.core_modules.remove_duplicates_methods as rdm

			@@ -107,7 +106,7 @@
			temp=[]
			temp.append(item[2]) #è®¾å¤ç¼å·
			temp.append('è®¾å¤æé') #è®¾å¤ç¼å·
			temp.append('1') #è®¾å¤æé
			temp.append('1') #ä¾çµå¼å¸¸
			temp.append('å¾æ±åº')
			temp.append(item[11]) #æéå¼å§æ¶é´
			startTimeSub= datetime.strptime(startTime,"%Y-%m-%d %H:%M") - timedelta(minutes = 10) #ç»æä¸ºdatetime.datetimeç±»å ï¼éè¦åè½¬ä¸ºåç¬¦ä¸²ç±»å
			@@ -178,6 +177,7 @@
			for i in power_supply_abnormal :
			print(i)


			#å°ä¾çµå¼å¸¸çä¿¡æ¯åå¥æ°æ®åºå¼å¸¸è¡¨ä¸
			abnormal_write_to_SQL(power_supply_abnormal,con) #å°è®¾å¤æéä¿¡æ¯åå¥å¼å¸¸è¡¨
			print('ä¾çµå¼å¸¸çä¿¡æ¯åå¥å¼å¸¸è¡¨å®æ!')
			@@ -314,9 +314,12 @@
			def refind_ea(list): #ä¸æ¡è®°å½ï¼ä¹å°±æ¯ä¸ä¸ªåè¡¨
			temp=[]
			temp.append(generate_short_uuid())
			# è®¾å¤ç¼å·
			temp.append(list[2])
			# åºéºåå
			temp.append(list[1])
			temp.append(list[0])
			# ä¾åºå
			temp.append(list[3])
			temp.append(1)
			print(temp)
			return temp
			@@ -388,7 +391,7 @@
			temp.append(list[7]) #ååå¨çµæµ 7
			temp.append(list[4]) #è¿æ²¹çæµåº¦å¼
			temp.append(list[5]) #ææ²¹çæµåº¦å¼
			temp.append(list[14]) #éå¤çæ¬¡æ°
			temp.append(list[13]) #éå¤çæ¬¡æ°

			print(temp)
			return temp

			@@ -16,7 +16,7 @@
			temp.append(list[7]) #ååå¨çµæµ 7
			temp.append(list[4]) #è¿æ²¹çæµåº¦å¼
			temp.append(list[5]) #ææ²¹çæµåº¦å¼
			temp.append(list[14]) #éå¤çæ¬¡æ°
			temp.append(list[13]) #éå¤çæ¬¡æ°

			print(temp)
			return temp

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,86 @@
			import sys
			import os
			sys.path.append(os.path.dirname(__file__))
			# sys.path.append('E:\\ruanjian\\Python\\Lib\\site-packages')



			from sqlalchemy import create_engine
			class DataBase:
			""" è¿ç¨æ°æ®åº """
			# con_read = None
			# con_write = None
			# ip = '114.215.109.124'
			# user = 'fumeRemote'
			# password = 'feiyu2023'
			# port = 3306
			# data_base_name = 'fume'


			""" æ¬æº """
			con_read = None
			con_write = None
			ip = 'localhost'
			user = 'root'
			password = '1234'
			port = 3306
			data_base_name = 'qianduan_sql'



			"""è¿æ¥æ°æ®åº
			"""
			def connect_remote_database_read(self):


			if self.con_read == None or self.con_read.closed:
			engine = create_engine(f"mysql+pymysql://{self.user}:{self.password}@{self.ip}:{self.port}/{self.data_base_name}?charset=utf8",pool_recycle=3600, pool_size=3, max_overflow=0)
			self.con_read = engine.connect()
			return self.con_read

			def connect_remote_database_write(self):
			""" å"""


			if self.con_write == None or self.con_write.closed:
			engine = create_engine(f"mysql+pymysql://{self.user}:{self.password}@{self.ip}:{self.port}/{self.data_base_name}?charset=utf8",pool_recycle=3600, pool_size=3, max_overflow=0)
			self.con_write = engine.connect()
			return self.con_write


			# """ è¿æ¥æ¬å°æ°æ®åº
			# """
			# def connect_local_database_read(self):
			# """ è¯»æ°æ®
			# """
			# if self.con_read == None or self.con_read.closed:
			# engine = create_engine(f"mysql+pymysql://{self.user}:{self.password}@{self.ip}:{self.port}/{self.data_base_name}?charset=utf8")
			# self.con_read = engine.connect()
			# return self.con_read

			# def connect_local_database_write(self):
			# """ åæ°æ®
			# """
			# if self.con_write == None or self.con_write.closed:
			# engine = create_engine(f"mysql+pymysql://{self.user}:{self.password}@{self.ip}:{self.port}/{self.data_base_name}?charset=utf8")
			# self.con_write = engine.connect()
			# return self.con_write


			def disconnect(self,area_type:str,option_type:str):
			""""æå¼è¿æ¥

			Args:
			area_type (str): æ°æ®åºæå±ä½ç½®ãlocalä¸remote
			option_type (str): æä½ç±»åãwriteåread
			"""

			self.con_read.close()


			# å¶ä»æä»¶å¯¼å¥æ¤å¯¹è±¡å³å¯
			datebase_single_obj = DataBase()

			if __name__ == '__main__':
			# print(datebase_single_obj.connect_remote_database_read())
			pass

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,92 @@
			from test_get_data.request import request_get
			from test_get_data.url_help import Url
			from test_get_data.login import *

			from bs4 import BeautifulSoup as bs
			import re #æ£åè¡¨è¾¾å¼
			import time

			import sys
			sys.path.append('../../')
			import src.core_modules.remove_duplicates_methods as rdm

			now_date = time.strftime("%Y-%m-%d", time.localtime()) #è·åå½åå¹´ææ¥ #urlç¼ç å¹´ææ¥å¼å§é»è®¤æ¶é´
			now_date1 = time.strftime("%Y-%m", time.localtime())
			month_begin=now_date1+'-01' #è®¾ç½®å½åæä»½çå¼å§

			list_temp=[] #ä¸´æ¶åè¡¨ å¨å±åé



			#-------------------------------------------------------------------------------------------------------------ç¹æ®çurl
			def get_OnePage_teshu(url,count=1): #æåä¸é¡µçæ°æ®,æ¾å¥list_dataä¸.urlsä¸ºè¦è®¿é®çç½é¡µå°å
			global list_temp #ä½¿ç¨å¨å±åé

			list_temp.clear() #æ¸ç©ºä¸´æ¶è¡¨

			r = request_get(url).text
			soup = bs(r,'html.parser')

			list=[] #åå»ºåè¡¨æ¥ä¿åç»æ

			# æ¾å°ææçtræ ç¾
			rows = soup.find_all('tr')

			# æåè¡¨æ ¼ä¸çæ°æ®
			result = []
			for row in rows:
			data = []
			cols = row.find_all('td')
			for col in cols:
			if col.find('div'):
			# å¦ætdä¸åå«divï¼ååç¬æåå¶åå®¹
			div_content = col.find('div').text.strip()
			# data.append(col.find('td').text.strip())
			# è¿ååç´ çææ¬åå®¹ æç´¢tagçç´æ¥åèç¹
			td_content = ''.join(col.find_all(text=True, recursive=False)).strip()
			data.append(td_content)
			data.append(div_content)
			else:
			# å¦ætdä¸ä¸åå«divï¼åç´æ¥æåtdçåå®¹
			td_content = col.text.strip()
			data.append(td_content)
			del (data[-2:])
			del (data[2])
			result.append(data)
			# å é¤è¡¨å¤´
			del (result[0])
			# æå°æåçæ°æ®
			print(result)



			# for tag in tags: # æ¯ä¸ªtagæ¯ä¸è¡
			# element = tag.text # è·å<tr>æ ç¾åææææ¬ä¿¡æ¯
			# element = element.strip() # å°åç¬¦ä¸²é¦å°¾ç©ºæ ¼å»é¤
			# list1 = element.split(); # ä»¥ç©ºæ ¼ä¸ºåéå°åç¬¦ä¸²åä¸ºåè¡¨

			# # del (list1[-2:]) #åè¡¨æåä¸¤ä¸ªåç´ ä¸éè¦,å é¤
			# # print('å é¤ç¹æ®çåä¸¤ä¸ª')
			# # print(list1)
			# list.append(list1)
			# print(list)

			# list_data=[]
			# for i in list:
			# list_data.append(merge(i)) #å°å°¾æ¥ææ°æ®åå¹¶æå¹´ææ¥ æ¶åç§
			# del list_data[0] #å é¤æåè¡¨å¤´
			# count=count-1 #å é¤äºè¡¨å¤´,æ»æ°æ®çè¡æ°åä¸
			# #print(lt_isates_list(list_data)[:] #å°æææ°æ®å¤å¶ç»ä¸´æ¶åè¡¨list_temp æ¯å»é¤éå¤åçåè¡¨
			# list_temp=list_data[:]
			# return count

			if __name__ == '__main__':
			# ç»å½
			login_fume_web()
			u = Url()
			urls = u.concatenate_url_with_condition('æ¨è®°é½é½åå°ç¤è','2023-10-01','2023-10-31',1)
			for item in urls:
			get_OnePage_teshu(item)

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,64 @@
			from test_get_data.request import request_post,request_get
			import time
			import json
			import base64

			import src.user.account_photo as account

			def get_time():
			# æ¯«ç§å¦çº§æ¶é´æ³ 13ä½æ°å
			now_time = str(int(time.time()*1000))
			return now_time

			def get_photo_url(url):
			return url + get_time()



			def base64_api(img):
			# è¿åè´¦å·å¯ç
			uname,pwd = account.back_account_password()
			with open(img, 'rb') as f:
			base64_data = base64.b64encode(f.read())
			b64 = base64_data.decode()
			data = {"username": uname, "password": pwd, "typeid": 2, "image": b64}
			result = json.loads(request_post("http://api.ttshitu.com/predict", data))
			if result['success']:
			return result["data"]["result"]
			else:
			#ï¼ï¼ï¼ï¼ï¼ï¼ï¼æ³¨æï¼è¿å äººå·¥ä¸è¶³ç éè¯¯æåµ è¯·å é»è¾å¤çé²æ¢èæ¬å¡æ» ç»§ç»éæ° è¯å«
			return result["message"]
			return ""



			def login_fume_web():
			# è¯·æ±éªè¯ç å°å
			# æé æ¶é´æ³
			# æ¼æ¥url
			# è¯å«éªè¯ç
			url_photo = get_photo_url('http://xhhb.senzly.cn/servlet/Vcode_new.serv?t=')
			response = request_get(url_photo) # å¾çä¸ºäºè¿å¶æ°æ®
			image_data = response.content
			with open('Vcode.jpg',mode='wb') as f:
			f.write(image_data)
			# éªè¯ç ç»æ
			v_code_result = base64_api('Vcode.jpg')


			play_load = {
			"account": "9SUBjEeNy7nFMzk123",
			"password": "6SUBIyusanb170e13a221a4cb58c66876006488504",
			"vcode": v_code_result
			}

			url_jump = 'http://xhhb.senzly.cn/cusLogin.php'
			request_post(url_jump,play_load)
			print('ç»å½æå')

			# return session
			# ä¸ªäººéªè¯


			if __name__ == '__main__':
			login_fume_web()

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,37 @@
			import requests
			import urllib3

			class MyRequest:
			def __init__(self):
			urllib3.disable_warnings()
			self.session = requests.session()
			self.session.headers = {
			"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36",
			}

			def get(self,url:str):
			r = self.session.get(url, verify=False)
			if r.status_code != 200:
			return False
			return r

			def post(self, url: str, params: dict):
			"""postè¯·æ±

			Args:
			url (str): ç®æ url
			params (dict): è¯·æ±åæ°

			Returns:
			_type_: ååºåå®¹
			"""
			r = self.session.post(url, data=params, verify=False)
			if r.status_code != 200:
			return False
			return r.text



			_my_request = MyRequest()
			request_post = _my_request.post
			request_get = _my_request.get

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,36 @@
			import urllib.parse

			class Url:

			def concatenate_url_with_condition(self,shop_name,date_begin,date_end,page_num)->list:
			"""å½¢æå®æ´çurl"""
			# ååç¼ç
			base_url = self.encoding_shop_name(shop_name)
			# å ä¸æ¥ææ¡ä»¶
			url_with_date = self.url_add_date(base_url,date_begin,date_end)
			# å ä¸é¡µæ°æ¡ä»¶
			sub_urls_wait_for_request = self.list_add_page(url_with_date,page_num)
			return sub_urls_wait_for_request



			def url_add_date(self,url,date_begin,date_end): #url,å¹´-æ-æ¥ 2023-05-03
			url_date=url+'&key5='+date_begin+'&key6='+date_end
			return url_date

			def list_add_page(self,url,page_num): # urlä¸çiæ¯é¡µ ,apge_numè¡¨ç¤ºç¬åçé¡µæ° ãurlåé¢å ä¸é¡µçåæ°
			urls = [url+'&page'+'={}'.format(str(i)) for i in range(1,page_num+1)]
			return urls

			def encoding_shop_name(self,shop_name):
			encoded_shop_name = urllib.parse.quote(urllib.parse.quote(shop_name))

			return 'http://xhhb.senzly.cn/sys/yyRealTimeValue_list.jsp?key1=&shop='+encoded_shop_name+'&pagesize=100'



			if __name__ == '__main__':
			u = Url()
			urls = u.concatenate_url_with_condition('é£å¶å®¶','2023-10-01','2023-10-31',5)
			for item in urls:
			print(item)