riku
2022-06-17 3a5c011d9509d3bc0367921f463676c81ff2e374
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
/*
 *  Copyright 2016, Plutext Pty Ltd.
 *   
 *  This file is part of docx4j.
 
    docx4j is licensed under the Apache License, Version 2.0 (the "License"); 
    you may not use this file except in compliance with the License. 
 
    You may obtain a copy of the License at 
 
        http://www.apache.org/licenses/LICENSE-2.0 
 
    Unless required by applicable law or agreed to in writing, software 
    distributed under the License is distributed on an "AS IS" BASIS, 
    WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. 
    See the License for the specific language governing permissions and 
    limitations under the License.
 
 */
 
package cn.flightfeather.supervision.docx4j.simpleDemo;
 
 
import org.docx4j.Docx4J;
import org.docx4j.XmlUtils;
import org.docx4j.jaxb.Context;
import org.docx4j.openpackaging.packages.WordprocessingMLPackage;
import org.docx4j.openpackaging.parts.StAXHandlerAbstract;
import org.docx4j.openpackaging.parts.WordprocessingML.MainDocumentPart;
 
import javax.xml.stream.XMLStreamException;
import javax.xml.stream.XMLStreamReader;
import javax.xml.stream.XMLStreamWriter;
import java.io.File;
import java.util.HashMap;
 
 
/**
 * This is an example of using StAX rather than JAXB for
 * processing.  StAX is useful for very large files, since
 * it uses less memory than JAXB.  There are also some
 * things StAX is better adapted for.
 * 
 * NB: There are at least 3 approaches for replacing variables in 
 * a docx.
 * 
 * 1. as shows in this example
 * 2. using Merge Fields (see org.docx4j.model.fields.merge.MailMerger)
 * 3. binding content controls to an XML Part (via XPath)
 * 
 * and this is not the recommended approach!
 * 
 * It is just a good example of using StAX.
 *
 */
public class VariableReplaceStAX {
 
    final static HashMap<String, String> mappings = new HashMap<String, String>();
    
    public static void main(String[] args) throws Exception {
        
        // Exclude context init from timing
        org.docx4j.wml.ObjectFactory foo = Context.getWmlObjectFactory();
 
        // Input docx has variables in it: ${colour}, ${icecream}
        String inputfilepath = System.getProperty("user.dir") + "/devicecount.docx";
 
        boolean save = true;
        String outputfilepath = System.getProperty("user.dir")
                + "/OUT_VariableReplaceStAX.docx";
 
        WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage
                .load(new File(inputfilepath));
        MainDocumentPart documentPart = wordMLPackage.getMainDocumentPart();
 
        mappings.put("colour", "green");
        mappings.put("icecream", "chocolate");
        
        long start = System.currentTimeMillis();
        
            documentPart.pipe( new MyStAXHandler() );
        
            
        long end = System.currentTimeMillis();
        long total = end - start;
        System.out.println("Time: " + total);
 
        // Save it
        if (save) {
//            SaveToZipFile saver = new SaveToZipFile(wordMLPackage);
//            saver.save(outputfilepath);
            
            Docx4J.save(wordMLPackage, new File(outputfilepath));
            
        } else {
            System.out.println(XmlUtils.marshaltoString(documentPart.getJaxbElement(), true,
                    true));
        }
    }
    
    public static class MyStAXHandler extends StAXHandlerAbstract {
        
        public void handleCharacters(XMLStreamReader xmlr, XMLStreamWriter writer) throws XMLStreamException {
            
            StringBuilder sb = new StringBuilder();
            sb.append(xmlr.getTextCharacters(), xmlr.getTextStart(), xmlr.getTextLength());
                                            
            String wmlString = replace(sb.toString(), 0, new StringBuilder(), mappings).toString();
//            System.out.println(wmlString);
            
            char[] charOut = wmlString.toCharArray();
            writer.writeCharacters(charOut, 0, charOut.length);
            
//            writer.writeCharacters(xmlr.getTextCharacters(),
//                    xmlr.getTextStart(), xmlr.getTextLength());
            
        }
        
         private StringBuilder replace(String wmlTemplateString, int offset, StringBuilder strB, 
                 java.util.Map<String, ?> mappings) {
             
            int startKey = wmlTemplateString.indexOf("${", offset);
            if (startKey == -1)
               return strB.append(wmlTemplateString.substring(offset));
            else {
               strB.append(wmlTemplateString.substring(offset, startKey));
               int keyEnd = wmlTemplateString.indexOf('}', startKey);
               if (keyEnd>0) {
                   String key = wmlTemplateString.substring(startKey + 2, keyEnd);
                   Object val = mappings.get(key);
                   if (val==null) {
                       System.out.println("Invalid key '" + key + "' or key not mapped to a value");
                       strB.append(key );
                   } else {
                       strB.append(val.toString()  );
                   }
                   return replace(wmlTemplateString, keyEnd + 1, strB, mappings);
               } else {
                   System.out.println("Invalid key: could not find '}' ");
                   strB.append("$");
                   return replace(wmlTemplateString, offset + 1, strB, mappings);                   
               }
            }
         }        
    }
 
}