feiyu02
2024-11-19 752e00503f672ddfe2066afb6c235721a3a912b5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
package cn.flightfeather.supervision.docx4j.simpleDemo;
 
import org.docx4j.XmlUtils;
import org.docx4j.openpackaging.packages.WordprocessingMLPackage;
import org.docx4j.openpackaging.parts.WordprocessingML.MainDocumentPart;
 
import java.util.List;
 
public class XPathQuery {
 
    
    /**
     * Example of how to find an object in document.xml
     * via XPath.
     * 
     * As explained in Getting Started, there are limitations 
     * in the JAXB reference implementation which make this
     * approach buggy:
     * 
     * 1. the xpath expressions are evaluated against the XML 
     * document as it was when first opened in docx4j.  You 
     * can update the associated XML document once only, by
     * passing true into getJAXBNodesViaXPath. Updating it again 
     * (with current JAXB 2.1.x or 2.2.x) will cause an error.
     * 
     * 2. For some objects,JAXB can’t get parent (with getParent)
     * 
     * 3. For some document, JAXB can’t set up the XPath at all!
     * 
     * If these problems affect you, you could try using
     * MOXy as your JAXB implementation (which docx4j supports
     * as from forthcoming docx4j 3.0).  See 
     * http://www.docx4java.org/forums/docx-java-f6/moxy-t1242.html
     * 
     * Alternatively, the tried and tested approach is
     * to use TraversalUtil;
     * see the OpenMainDocumentAndTraverse sample.
     * 
     */
    public static void main(String[] args) throws Exception {
 
        String inputfilepath = System.getProperty("user.dir") + "/sample-docs/word/sample-docx.xml";
                
        WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(new java.io.File(inputfilepath));        
        MainDocumentPart documentPart = wordMLPackage.getMainDocumentPart();
                
        String xpath = "//w:t[contains(text(),'scaled')]";
        //String xpath = "//w:r[w:t[contains(text(),'scaled')]]";
        
        List<Object> list = documentPart.getJAXBNodesViaXPath(xpath, false);
        
        System.out.println("got " + list.size() + " matching " + xpath );
        
        for (Object o : list) {
            
            //System.out.println(o.getClass().getName() );
            
            Object o2 = XmlUtils.unwrap(o);
            // this is ok, provided the results of the Callback
            // won't be marshalled            
            
            if (o2 instanceof org.docx4j.wml.Text) {
                
                org.docx4j.wml.Text txt = (org.docx4j.wml.Text)o2;
                
                System.out.println( txt.getValue() );
                
                // Demonstrate the getParent bug
                //Object parent = txt.getParent();            
                //System.out.println( "parent: " +  XmlUtils.unwrap(parent).getClass().getName() );
            } else {
                System.out.println( XmlUtils.marshaltoString(o, true, true));
            }
 
            
            
        }
                        
    }
    
        
}